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读者 评论 


我 觉得 你 的 文章 跟 一 般 Java 教 程 最 大 的 不 同 在 于 ， 你 把 各 个 知识 
点 的 “为 什么 ”者 解释 得 很 清楚 ， 非 党 对 味 ， 非 常 感谢 。 很 多 网 上 教 
程 ， 都 旦 直接 教 如 何 做 的 ， 主 要 走动 手 能 力 。 可 是 做 完了 还 是 云 里 筋 
里 。 结 合 你 的 文章 ， 一 下 子 就 通 透 了 。 


Hannah 


老 扎 说 编程 ， 太 好 了 。 把 神秘 的 编程 ， 通 俗 地 讲解 ， 使 编程 者 认 
识 了 本 质 。 每 个 专题 的 介绍 都 是 深入 浅 出 ， 有 分 析 ， 有 总 结 ， 有 详细 
例子 ， 真 古 爱 不 释 手 的 宝 书 。 


一 一 张 工 采 成 


其 实 老 马 写 的 东西 网 上 都 有 大 把 的 类 似 文章 ， 但 是 老 马 总 是 能 把 
复杂 的 东西 讲 得 深入 浅 出 ， 把 看 似 简单 的 东西 分 析 得 细致 深入 ! 


VitaminChen 


文 草 比 其 他 文 草 的 腕 上 态 ， 有 情景 市 入， 重点 突出 ， 让 人 耳目 一 
新 ， 读 起 来 很 方便 。 感 谢 圣 藻 付 出 。 


hellojd 


里 然 我 使 用 Java 多 年 ， 可 是 阅读 作者 的 文章 仍然 觉得 受益 菲 浅 。 
并 发 尽 结 得 很 好 ， 对 前 面 讲 的 并 发 知识 作 了 很 好 的 总 结 和 梳理 。 


绢 越 
我 不 是 初学 者 ， 依 然 能 从 这 里 学 到 很 多 东西 。 对 不 了 解 原理 的 非 


切 学 者 来 说 ， 像 回头 失落 下 的 宝贝 似 的 。 关 于 编码 ， 之 前 一 直 云 里 筋 
里 的 ， 找 了 几 篇 文章 都 没 读 进 去 。 你 的 讲解 浅显 易 懂 ! 


Keyirei 


用 平实 的 语言 把 计算 机 科学 的 思维 方法 由 浅 入 深 ， 九 妮 道 来 ， 让 
人 如 沐 春 风 ， 醋 酮 灌顶 。 这 里 面 没有 复制 、 粘 贴 的 拼 诅 ， 更 没有 生硬 


古怪 的 翻译 腔 ， 文 章 中 句 句 都 能 感觉 到 老 马 理解 、 实 践 、 和 贯通 后 表达 
出 来 的 逻辑 严密 周全 和 通 透 流畅 。 


一 一 杜 鹏 


最 近 从 PHP 转 Java， 从 您 的 文 草 学 到 了 很 多 知识 ， 很 系统 地 重 构 
了 对 计算 机 以 及 程序 语言 的 认 知 ， 很 感谢 。 


一 一 房改 


多 线程 一 直 连 概念 也 模 业 ， 阅 读 后 真 的 受益 菲 浅 ! 异常 处 理 ， 看 
着 简单 ， 刚 开始 学 习 时 ， 目 己 也 是 胡乱 try 和 throw， 不 过 到 开发 时 ， 才 
体会 到 正确 处 理 的 重要 性 。 感 谢 这 篇 文章 。 比 起 学 习 使 用 庞大 的 框 
架 ， 我 觉得 基础 知识 是 更 重要 的 ， 对 于 一 个 知识 点 的 理解 ， 细 细 琢 
匡 知道 实现 原理 ， 也 是 一 种 收获 。 


一 ”Chain 


为 什么 要 写 这 本 书 


写 一 本 关于 编程 的 书 ， 是 我 大 概 15 年 前 就 有 的 一 个 想法 ， 当 时 ， 
我 体会 到 了 编程 中 数据 结构 的 美妙 和 神奇 ， 有 一 种 收获 的 喜悦 和 分 孚 
的 冲动 。 这 种 收获 是 我 反复 阅读 教程 十 几 裔 ， 伦 大 量 时 间 上 机 练习 调 
试 得 到 的 ， 这 是 一 个 比较 痛 藻 的 过 程 。 我 想 ， 如 有 果 把 我 学 到 的 知识 更 
为 清晰 易 慌 地 表达 出 来 ， 其 他 人 人 不整 可 以 掌握 编程 容易 一 些 ， 并 体会 
到 那 种 喜悦 了 吗 ? 不 过 ， 当 时 感觉 目 己 学 识 太 浅 ， 要 学 习 的 东西 太 
多 ， 想 一 想 也 就 算 了 。 


触发 我 开始 写作 是 在 2016 年 年 初 ， 可 汗 学 院 的 事迹 震撼 了 我 。 可 
省 学 院 的 创始 人 是 院 尔 曼 ' 可 尘 ， 他 目 己 孙 制 了 3000 多 个 短视 频 ， 主 要 
教 中 小 学 生 基础 课 。 他 为 每 门 课程 建立 了 知识 地 图 ， 地 图 由 知识 点 组 
成 ， 知 识 点 之 间 有 依赖 关系 。 每 个 知识 点 都 有 一 个 视频 ， 每 个 视频 10 
分 钟 左 右 ， 他 的 讲解 清晰 透彻 ， 极 受 欢 迎 。 比 尔 : 盖 深 声 称 可 汗 是 他 最 
欣赏 的 老师 ， 邀 请 其 在 TED 发 表演 讲 ， 同 时 投资 可 汗 成 立 了 非 营 利 机 
构 可 主 学院， 可 证 也 受到 了 来 目 谷 歌 等 公司 的 投资 。 可 以 说 ， 可 汗 以 
一 己 之 力 推动 了 全 世界 的 教育 。 


我 束 想 ， 我 可 不 可 以 学 习 可 汗 ， 为 计算 机 编程 教育 做 一 点 事情 ? 
也 就 是 说 ， 为 编程 的 核心 知识 建立 知识 地 图 ， 从 最 基础 的 概念 开始 ， 
分 解 为 知识 点 ， 一 个 知识 点 一 个 知识 点 地 讲解 ， 每 一 个 知识 点 都 力争 
清晰 透彻 ， 曾 述 知 识 点 是 什么 、 怎 么 用 、 有 什么 用 途 、 实 现 原 理 是 什 
么 、 思 维 逻 辑 是 什么 、 与 其 他 知识 点 有 什么 关系 等 。 可 汗 的 形式 旦 视 
频 ， 但 我 想 先 从 文字 总 结 开 始 。 我 希望 表达 的 是 编程 的 通用 知识 ， 但 
编程 总 要 用 一 个 具体 语言 ， 我 想 束 用 我 最 熟悉 的 Java 吧 。 


过 去 十 几 年 ，Java 一 直 是 软件 开发 领域 最 主流 的 语言 之 一 ， 在 可 
以 预见 的 未 来 ，Java 还 将 是 最 主流 的 语言 之 一 。 但 关于 Java 编 程 的 书 
比比 背 是 ， 也 不 乏 经 典 之 作 ， 市 场 还 需要 一 本 天 于 Java 编 程 的 书 吗 ? 
甚至 ， 还 需要 编程 的 书 吗 ? 如 果 需 要 ， 需 要 什么 样 的 书 呢 ? 


关于 编程 的 需求 ， 我 想 答 案 是 肯定 的 。 过 去 儿 十 年 ，IT 半 命 深 刻 
地 改变 了 人 们 的 生活 ， 但 这 次 音 命 还 远 远 没有 停止 ， 在 可 以 预见 的 未 


来 ， 人 工 逢 能 等 前 治 技术 必 将 进一步 改变 世界 ， 而 要 掌握 人 工 智能 技 
术 ， 必 须 移 掌握 基本 编程 技术 。 人 工 智 能 在 我 国 已 经 上 升 为 国家 战 
略 。2017 年 7 月 ， 国 务 院 印 发 了 《新 一 代 人 工 智 能 发 展 规划 》， 其 中 提 
到 “实施 全 民智 能 教育 项 目 ， 在 中 小 学 阶段 设置 人 工 智 能 相关 谍 程 ， 逐 
步 推广 编程 教育 ”， 未 来 ， 可 能 大 部 分 人 都 需要 学 习 编程 。 


天 于 编程 的 书 是 很 多 ， 但 对 于 非 计 算 机 专业 学 生 而 言 ， 掌 握 编程 
依然 是 一 件 困难 的 事情 。 绝 大 部 分 教程 以 及 培训 班 过 于 追求 应 用 ， 该 
者 学 完 之 后 虽然 能 照 着 例子 写 一 些 程 序 ， 但 却 情 情 懂 懂 ， 知 其 然而 不 
知 其 所 以 然 ， 无 法 灵活 应 用 ， 当 希望 进一步 深入 学 习 时 ， 发 现 大 部 分 
0 
原理 类 书籍 。 


即使 计算 机 专业 的 学 生 ， 学 习 编 程 也 不 容易 。 学 校 开设 了 很 多 理 
论 课程 ， 但 学 习 理论 的 时 候 往往 感觉 比较 村 燥 ， 比 如 二 进 制 、 编 码 、 
数据 结构 和 算法 、 设 计 模 式 、 操 作 系统 中 的 线程 和 文件 系统 知识 等 。 
而 学 习 具 体 编程 语言 的 时 候 ， 又 侧重 学 习 的 是 语法 和 API。 学 习 计 算 
机 理论 的 重要 目的 是 为 了 更 好 地 编程 ， 但 学 生 却 难以 在 理论 和 编程 之 
间 建 立 密切 的 联系 。 


这 样 ， 我 的 想法 基本 束 确 定 了 ， 用 Java 语 言 写 一 本 帮助 理解 编程 
到 属 是 怎么 回 事 的 书 ， 尽 量 用 通俗 易 懂 的 方式 循序 渐进 地 介绍 编程 中 
的 主要 概念 、 语 法 和 类 库 ， 不 仅 介 绍 用 法 和 应 用 ， 还 剖析 育 后 的 实现 
原理 ， 以 与 基础 理论 相 结合 ， 同 时 包含 一 些 实用 经 验 和 教训 ， 并 解释 
一 些 更 为 高 层 的 框架 和 库 的 基本 原理 ， 以 与 实践 应 用 相 结 合 ， 在 此 过 
程 中 ， 融 合 编程 的 一 些 通 用 思维 逻辑。 


我 有 能 力 写 好 吗 ? 我 并 不 是 编程 大 师 ， 但 我 想 ， 可 证 也 不 是 每 个 
领域 的 大 师 ， 但 他 讲授 了 很 多 领域 的 知识 ， 的 确 帮助 了 很 多 人 “。 过 去 
十 几 年 我 一 直 从 事 编 程 方面 的 工作 ， 也 在 不 断 学 习 和 思考 ， 我 想 ， 只 
要 用 心 写 ， 至 少 会 给 一 些 人 市 来 一 点 帮助 吧 。 


于 是 ， 我 在 2016 年 3 月 创建 了 微 信 公众 号 “ 老 马 说 编程 ”， 开 始 发 布 
系列 文章 “计算机 程序 的 思维 逻辑 ”。 每 一 篇 文章 对 我 都 是 一 个 挑战 ， 
每 一 个 知识 点 我 都 化 大 量 时 间 用 心思 考 ， 反 复 琢 请 ， 力 求 表达 清晰 透 
彻 ， 做 到 最 好 。 写 作 是 一 个 痛 杏 和 快乐 交织 的 过 程 ， 节 痛 癌 的 就 是 满 
脑子 都 是 相关 的 内 容 ， 但 吏 是 不 知道 该 怎么 表达 的 时 候 ， 而 最 快乐 的 
就 是 写 完 一 篇 文章 的 时 候 。 令 人 欣 感 的 是 ， 这 些 文章 受到 了 大 量 读者 


的 极 高 评价 ， 他 们 的 海 美 之 词 、 目 发 分 齐 和 红包 赞赏 进一步 增强 了 我 
写作 的 信心 和 动力 。 到 2017 年 7 月 压 ， 共 写 了 95 篇 文 草 ， 关 于 Java 编 程 
的 基本 内 容 也 就 写 完 了 。 


在 写作 过 程 中 ， 很 多 读者 反馈 希望 文章 可 以 尽快 整理 成 书 ， 以 便 
阅读 。2016 年 9 月 ， 机 械 工 业 出 版 社 的 高 婧 雅 女士 联系 到 了 我 ， 商 讨 出 
人 
Se 


本 书 特色 


本 书 致力 于 帮助 读者 真正 理解 Java 编 程 。 对 于 每 个 语言 特性 和 
API， 不 仅 介 绍 其 概念 和 用 法 ， 还 分 析 了 为 什么 要 有 这 个 概念 ， 实 现 
原理 是 什么 ， 育 后 的 思维 逻辑 是 什么 ， 对 于 类 库 ， 分 析 了 大 量 源码 ， 
使 读者 不 仅 知 其 然 ， 还 知 其 所 以 然 ， 以 透彻 理解 相关 知识 点 。 


本 书 虽 然 是 Java 语 言 描述 ， 但 以 更 为 通用 的 编程 逻辑 为 主 ， 融 入 
了 很 多 通用 的 编程 相关 知识 ， 如 二 进 制 、 编 码 、 数 据 结 构 和 算法 、 设 
计 模 式 、 操 作 系统 、 编 程 思 维 等 ， 使 读者 不 仅 能 够 学 习 Java 语 言 ， 还 
可 以 提升 整体 的 编程 和 计算 机 水 平 。 


本 书 不 仅 注 重 实现 原理 ， 而 且 重 视 实用 性 。 本 书 介绍 了 很 多 实践 
中 党 用 的 技术 ， 包 含 不 少 实际 开发 中 积 崇 的 经 验 和 教训 ， 使 读者 可 以 
少 走 一 些 弯 路 。 在 实际 开发 中 ， 我 们 经 常 使 用 一 些 高 层 的 系统 程序 、 
框架 和 库 ， 以 提升 开发 效率 ， 本 书 也 介绍 了 如 何 利 用 基本 API 开 发 一 
些 系 统 程序 和 框架 ， 比 如 键 值 数据 库 、 消 忌 队 列 、 序 列 化 框架 、DI 
(依赖 注入 ) 容器 、AOP ( 面 问 切面 编程 ) 框架 、 热 部 署 、 模 板 引 擎 
等 ， 讲 解 这 些 内 容 的 目的 不 十 为 了 “重新 发 明 轮子 ”， 而 是 为 了 帮助 读 
者 更 好 地 理解 和 应 用 高 层 的 系统 程序 与 框架 。 


本 书 高 度 注 重 表述 ， 尽 力 站 在 读者 的 角度 ， 循 序 渐进 、 人 简洁 透 
彻 ， 从 最 基本 的 概念 开始 ， 一 步 步 推导 出 更 为 高 级 的 概念 ， 在 介绍 每 
个 知识 点 时 ， 都 会 尽力 移 介 绍 用 法 、 示 例 和 应 用 ， 再 分 析 实 现 原理 和 
思维 逻辑 ， 并 与 其 他 知识 点 建立 联系 ， 以 便 读 者 能 够 容易 地 、 全 面 透 
彻 地 理解 相关 知识 。 


本 书 侧 重 于 Java 编 程 的 主要 概念 ， 绝 大 部 分 内 容 适 用 于 Java 5 以 上 
的 版 本 ， 但 也 包含 了 最 近 几 年 Java 的 主要 更 新 ， 包 括 Java 8 引入 的 重要 


更 新 一 Lambda 表达 式 和 函数 化 编程 。 
读者 对 象 


本 书面 同 所 有 和 硕 望 进一步 理解 编程 的 主要 概念 、 实 现 原 理 和 思维 
逻辑 的 读者 ， 具 体 来 说 有 以 下 几 种 。 


初中 级 Java 开 发 者 : 本 书 采用 Java 语 言 ， 侧 重 于 剖析 编程 概念 表 
后 的 实现 原理 和 内 在 逻辑 ， 同 时 包含 很 多 实际 编程 中 的 经 验 教训 ， 所 
以 ， 对 于 Java 编 程 经 历 不 多 ， 对 计算 机 原理 不 太 了 解 、 对 Java 的 很 多 
概念 一 知 半 解 的 开发 人 员 ， 阅 读本 书 的 收获 可 能 最 大 ， 通 过 本 书 可 以 
快速 提升 Java 编 程 水 平 。 而 零 基础 Java 开 发 者 ， 可 跳 过 原理 性 内 容 阅 
读 。 


非 Java 语 言 的 开发 者 : 本 书 不 假设 读者 有 任何 Java 编 程 基础 ， 系 
统 、 人 全面、 细致 地 讲述 了 Java 的 语法 和 类 库 ， 给 出 了 很 多 示例 。 另 
外 ， 本 书 介 绍 了 很 多 编程 的 通用 概念 、 知 识 、 数 据 结 构 、 设 计 模 式 、 
算法 、 实 现 原理 和 思维 逻辑 。 同 时 ， 全 书 的 讨论 都 尽量 站 在 一 个 通用 
的 编程 语言 角度 ， 而 非 Java 语 言 特定 的 角度 。 通 过 阅读 本 书 ， 读 者 可 
交合 
思维 [7 a 


中 高 级 Java 开 发 者 : 经 验 丰 富 的 Java 开 发 者 阅读 本 书 的 收获 也 会 
很 大 ， 可 以 通过 本 书 对 编程 有 更 为 系统 、 更 为 深刻 的 认识 。 


如 何 辕 读本 书 
本 书 分 为 六 大 部 分 ， 共 26 章 内 容 。 


第 一 部 分 〈 第 1~2 章 ) 介绍 编程 基础 与 二 进 制 。 第 1 章 介 绍 编程 
的 基础 知识 ， 包 括 数据 类 型 、 变 量 、 赋 值 、 基 本 运算 、 条 件 执行 、 循 
环 和 函数 。 第 2 章 帮 助 读者 理解 数据 背后 的 二 进 制 ， 包 括 整 数 的 二 进 制 
表示 与 位 运算 、 小 数 计算 为 什么 会 出 错 、 字 符 的 编码 与 乱码 。 


第 二 部 分 〈 第 3 一 7 草 ) 介绍 面向 对 象 。 第 3 章 介绍 类 的 基础 知 
识 ， 包 括 类 的 基本 概念 、 类 的 组 合 以 及 代码 的 基本 组 织 机 制 。 第 4 章 介 
绍 类 的 继承 ， 包 括 继承 的 基本 概念 、 细 下 、 实 现 原 理 ， 分 析 为 什么 说 
继承 是 把 双 刃 剑 。 第 5 章 介 绍 类 的 一 些 扩展 概念 ， 包 括 接口 、 抽 和 象 类 、 
内 部 类 和 枚 举 。 第 6 章 介绍 异常 。 第 7 章 谢 析 一 些 常 用 基础 类 ， 包 括 包 
装 类 、String、StringBuilder、Arrays、 日 期 和 时 间 、 随 机 。 


第 三 部 分 〈 第 8~12 章 ) 介绍 泛 型 与 容器 及 其 背后 的 数据 结构 和 
算法 。 第 8 章 介绍 泛 型 ， 包 括 其 基本 概念 和 原理 、 通 配 符 ， 以 及 一 些 细 
玫 和 局 限 性 。 第 9 章 介 绍 列表 和 队列 ， 齐 析 ArrayList、LinkedList 以 及 
ArrayDeque。 人 第 10 章 介绍 各 种 Map 和 Set， 谢 析 HashMap、HashSet、 排 
序 二 义 树 、TreeMap 、TreeSet 、LinkedHashMap 、LinkedHashSet 、 
EnumMap 和 EnumSet。 第 11 章 介绍 堆 与 优先 级 队列 ， 包 括 堆 的 概念 和 
算法 及 其 应 用 。 第 12 章 介绍 一 些 抽象 容 右 类 ， 分 析 通 用 工具 类 
Collections， 最 后 对 整个 容 右 类 体系 从 多 个 角度 进行 系统 总 结 。 


第 四 部 分 (第 13~~14 章 ) 介绍 文件 。 第 13 章 主要 介绍 文件 的 基本 
技术 ， 包 括 文件 的 一 些 基 本 概念 和 第 识 、Java 中 处 理 文件 的 基本 结 
构 、 二 进 制 文 件 和 字 节 流 、 文 本 文件 和 字符 流 ， 以 及 文件 和 目录 操 
作 。 第 14 章 介绍 文件 处 理 的 一 些 高 级 技术 ， 包 括 一 些 常 见 文件 类 型 的 
| ` 内 存 上 映射 文件 、 标 准 序列 化 机 制 ， 以 及 Jackson 
部 列 化 。 


第 五 部 分 〈 第 15~20 章 ) 介绍 并 发 。 第 15 章 介绍 并 发 的 传统 基础 
知识 ， 包 括 线程 的 基本 概念 、 线 程 同步 的 基本 机 制 synchronized、 线 程 
协作 的 基本 机 制 waiynotify， 以 及 线程 的 中 断 。 第 16 章 介绍 并 发 包 的 基 
石 ， 包 括 原 子 变 量 和 CAS、 显 式 锁 与 显 式 条 件 。 第 17 章 介绍 并 发 容 
器 ， 包 括 写 时 复制 的 List 和 Set、ConcurrentHashMap、 基 于 跳 表 的 Map 
和 Set， 以 及 各 种 并 发 队列 。 第 18 章 介绍 异步 任务 执行 服务 ， 包 括 基本 
概念 和 实现 原理 、 主 要 的 实现 机 制 线程 池 ， 以 及 定时 任务 。 第 19 章 介 
绍 一 些 专门 的 同步 和 协作 工具 类 ， 包 括 读 写 锁 、 信 和 号 量 、 倒 计时 门 
栓 、 循 环 栅栏 ， 以 及 ThreadLocal。 第 20 章 对 整个 并 发 部 分 从 多 个 角度 
进行 系统 总 结 。 


第 六 部 分 (第 21~~26 章 ) 介绍 动态 与 国 数 式 编程 。 第 21 章 介绍 反 
射 ， 包 括 反 射 的 用 法 和 应 用 。 第 22 章 介绍 注解 ， 包 括 注解 的 使 用 、 创 
建 ， 以 及 两 个 应 用 : 定制 序列 化 和 DI 容 器 。 第 23 章 介绍 动态 代理 的 用 
法 和 原理 ， 包 括 Java SDK 动 态 代 理 和 cglib 动 态 代 理 以 及 一 个 应 用 : 


AOP。 第 24 章 介绍 类 加 载 机 制 ， 包 括 类 加 载 的 基本 机 制 和 过 程 ， 
ClassLoader 的 用 法 和 目 定 义 ， 以 及 它们 的 应 用 : 可 配置 的 策略 与 热 部 
署 。 第 25 章 介绍 正则 表达 式 ， 包 括 语 法 、Java API、 一 个 简单 的 应 用 

(模板 引擎 ) ， 最 后 剖析 一 些 常 见 表 达 式 。 第 26 章 介绍 Java 8 引入 的 画 
数 式 编程 ， 包 括 Lambda 表 达 式 、 函 数 式 数据 处 理 、 组 合式 异步 编程 ， 
以 及 Java 8 的 日 期 和 时 间 API。 


对 于 有 一 定 经 验 的 读者 ， 可 以 挑选 感 兴趣 的 章节 直接 阅读 。 而 对 
于 初学 者 ， 建 议 从 头 阅读 ， 但 对 于 一 些 比较 深入 的 原理 性 内 容 ， 以 及 
一 些 比 较 高 级 的 内 容 ， 如 果 理 解 比 较 困 难 可 以 跳 过 ， 有 一 定 实 践 经 验 
后 再 回头 阅读 。 任 何 读者 都 可 以 将 本 书 作为 一 本 案头 参考 书 ， 以 备 随 
时 查阅 不 确定 的 概念 、 用 法 和 原理 。 


勘误 和 文 持 


由 于 笔者 的 水 平 有 限 ， 编 写 时 间 仓 促 ， 书 中 难免 会 出 现 一 些 错误 
或 者 不 准确 的 地 方 ， 有 恳请 读者 批评 指正 。 如 果 读 者 有 更 多 的 军 贵 意 
见 ， 欢 迎 关 注 我 的 徽 信 公众 号 “ 老 马 说 编程 >， 可 在 后 台 留 言 ， 在 “ 关 
于 ”部 分 也 有 最 新 的 微 信 和 QQ 群 信 息 ， 欢 迎 加 入 讨论 ， 我 会 尽量 提供 
满意 的 解答 。 同 时 ， 读 者 也 可 以 通过 邮箱 swiftma@sina.com 联 系 到 
我 。 期 得 得 到 你 们 的 真 英 反馈 ， 在 技术 之 路 上 互 秽 共 进 。 


致谢 
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修正 。 


感谢 据 金 和 开发 者 头条 技术 社区 ， 他 们 经 党 推荐 我 的 文章 ， 使 更 
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感谢 我 在 北京 理工 大 学 学 习 时 的 老师 和 同学 们 ， 在 老师 的 教导 和 
同学 们 的 探讨 中 ， 我 掌握 了 比较 扎实 的 计算 机 基础 ， 特 别 是 我 的 已 故 
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不 断 提高 自己 的 技术 水 平 。 


感谢 机 械 工 业 出 版 社 的 编辑 高 婧 雅 ， 在 一 年 多 的 时 间 中 始终 文 持 
我 的 写作 ， 她 的 帮助 和 建议 引导 我 顺利 完成 全 部 书稿 。 


特别 致谢 


特别 感谢 我 的 爱人 及 特 和 儿子 久久 ， 我 为 写作 这 本 书 ， 牺 牲 了 很 
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特别 感谢 我 后 父母 ， 特 别 是 我 的 后母， 不 遗 余力 地 帮助 我 们 照顾 
儿子 ， 有 了 他 们 的 帮助 和 支持 ， 我 才 有 时 间 和 精力 去 完成 写作 工作 。 


等 别 感 谢 我 的 父母 ， 他 们 在 困难 的 生活 条 件 下 ， 付 出 了 巨大 的 证 
水 与 心血 ， 将 我 养育 成 人 ， 使 我 能 够 完成 博士 学 业 ， 他 们 一 生 勤 劳 村 
素 的 品质 深 深 地 影响 了 我 。 


特别 感谢 我 的 兄长 马 俊杰 ， 他 一 直 是 我 成 长 路 上 的 指明 灯 ， 也 是 
从 他 的 耐心 讲解 中 我 第 一 次 了 解 到 了 计算 机 的 基本 工作 机 制 。 


| 遵 以 此 天 给 我 最 素 爱 的 家 人 ， 以 及 众多 然 爱 编程 技术 的 朋友 
门 ! 


马 俊昌 


第 一 部 分 “编程 基础 与 二 进 制 
.第 1 章 ”编程 基础 
:第 2 章 ”理解 数据 背后 的 二 进 制 


第 1 章 ”编程 基础 
_ 我 们 先 来 简单 介绍 何谓 编程 ， 以 及 编 出 来 的 程序 大 概 是 什么 样 


计算 机 是 个 机 器 ， 这 个 机 絮 主 要 由 CPU、 内 存 、 人 硬盘 和 输入 /输出 
设备 组 成 。 计 算 机 上 跑 着 操作 系统 ， 如 Windows 或 Linux， 控 作 系 统 
运行 着 各 种 应 用 程序 ， 如 Word、QQ 等 。 


操作 系统 将 时 间 分 成 很 多 细小 的 时 间 片 ， 一 个 时 间 片 给 一 个 程序 
用 ， 男 一 个 时 间 厂 给 男 一 个 程序 用 ， 并 频繁 地 在 程序 间 切 换 。 不 过 ， 
在 应 用 程序 看 来 ， 整 个 机 器 资源 好 像 都 归 它 使 用 ， 操 作 系统 给 它 制 造 
了 这 种 假象 。 对 程序 员 而 言 ， 编 写 程序 时 基本 不 用 考虑 其 他 应 用 程 
序 ， 做 好 目 己 的 事 吏 可 以 了 。 


应 用 程序 看 上 去 能 做 很 多 事情 ， 能 读 写 文 档 、 能 播放 音乐 、 能 聊 
天 、 能 玩 游戏 、 能 下 围棋 等 ， 但 本 质 上 ， 计 算 机 只 会 执行 预先 写 好 的 
日 令 而 已 ， 这 些 指 令 也 只 坪 操 作 数 据 或 者 设备 。 所 谓 程序 ， 基 本 上 惑 
深 作 ， 比 如 : 


本 


2) 写 文档 ， 就 是 将 数据 从 内 存 写 回 磁盘 ; 

3) 播放 音乐 ， 就 是 将 音乐 的 数据 加 载 到 内 存 ， 然 后 写 到 声卡 上 

4) 聊天 ， 就 是 从 键盘 接收 聊天 数据 ， 放 到 内 存 ， 然 后 传 给 网 卡 ， 
i 


[© 


基本 上 ， 所 有 数据 都 需要 放 到 内 存 进行 处 理 ， 程 序 的 很 大 一 部 分 
工作 束 是 操作 在 内 存 中 的 数据 。 那 具体 如 何 表 示 和 操作 数据 呢 ? 本章 
介绍 一 些 基 础 知识 ， 具 体 分 为 7 个 小 和 。 


数据 在 计算 机 内 部 都 是 二 进 制 表示 的 ， 不 方便 操作 ， 为 了 方便 操 
作 数 据 ， 高 级 语言 引入 了 数据 类 型 和 变量 的 概念 ， 这 两 个 概念 我 们 在 


1.1 方 介绍。 
表示 了 数据 后 ，1.2 节 介绍 能 对 数据 进行 的 第 一 个 操作 : 赋值 。 


数据 有 了 初始 值 之 后 ，1.3 市 介绍 可 以 对 数据 进行 的 一 些 基 本 运 
Nn 征 因为 最 初 发 明 它 的 主要 目的 也 是 
为 了 编写 有 实用 功能 的 程序 ， 只 进行 基本 运算 是 远 远 不 够 的 ， 至 
少 需要 对 操作 的 过 程 进行 流程 控制 。 流 程控 制 有 两 种 : 一 种 是 条 件 执 
行 ， 另 外 一 种 是 循环 。 我 们 分 别 在 1.47 和 1.5 末 介绍 。 
为 了 减少 重复 代码 和 分 解 复杂 操作 ， 计 算 机 程序 引入 函 数 和 了 于 
0 ， 我 们 分 别 在 1.6 节 和 1.7 市 介绍 函数 的 用 法 和 画 数 调用 的 基 
原理 。 


Ie 


1.1 数据 类 型 和 变量 


II 


数据 类 型 用 于 对 数据 归 类 ， 以 便于 理解 和 操作 。 对 Java 语 言 


， 有 如 下 基本 数据 类 型 。 


.整数 类 型 : 有 4 种 整 型 byte/shorUinVlong， 分 别 有 不 同 的 取 值 苑 


小 数 类 型 : 有 两 种 类 型 float/double， 有 不 同 的 取 值 范围 和 精度 ; 
:字符 类 型 ， char， 表 示 单 个 字符 ; 
` 真 假 类 型 : boolean， 表 示 真 假 。 
基本 数据 类 型 都 有 对 应 的 数组 类 型 ， 数 组 表示 固定 长 度 的 同 种 数 


据 类 型 的 多 条 记录 ， 这 些 数据 在 内 存 中 连续 存放 。 比 如 ， 一 个 目 然 数 
可 以 用 一 个 整数 类 型 数据 表示 ，100 个 连续 的 自然 数 可 以 用 一 个 长 度 为 
100 的 整数 数组 表示 。 一 个 字符 可 以 用 一 个 char 类 型 数据 表示 ， 一 段 文 
字 可 以 用 一 个 char 数 组 表示 。 


Java 是 面 同 对 象 的 语言 ， 除 了 基本 数据 类 型 ， 其 他 都 是 对 象 类 


型 。 对 象 到 抵 是 什么 呢 ? 简单 地 说 ， 对 象 是 由 基本 数据 类 型 、 数 组 和 
其 他 对 象 组 合 而 成 的 一 个 东西 ， 以 方便 对 其 整体 进行 操作 。 比 如 ， 一 
个 学 生 对 象 ， 可 以 由 如 下 信息 组 成 。 


姓名 :一 个 字符 数组 ; 

-年龄 : 一 个 整数 ; 

性 别 : 二 个 学 八 ， 

:入 学 分 数 : 一 个 小 数 。 

日 期 在 Java 中 也 是 一 个 对 象 ， 内 部 表示 为 整 型 long 。 

世界 万 物 都 是 由 元 素 周期 表 中 的 基本 元 素 组 成 的 ， 基 本 数据 类 型 


束 相 当 于 化 学 中 的 基本 元 素 ， 而 对 象 束 相当 于 世界 万 物 。 


为 了 操作 数据 ， 需 要 把 数据 存放 到 内 存 中 。 上 所 谓 内 存在 程序 看 来 
束 是 一 块 有 地 址 编号 的 连续 的 空间 ， 数 据 放 到 内 存 中 的 某 个 位 置 后 ， 
为 了 方便 地 找到 和 操作 这 个 数据 ， 需 要 给 这 个 位 置 起 一 个 名 字 。 编 程 


语言 通过 变量 这 个 概念 来 表示 这 个 过 程 。 


声明 一 个 变量 ， 比 如 inta， 其 实 就 是 在 内 存 中 分 配 了 一 块 空间 ， 
这 块 空间 存放 int 数 据 类 型 ，a 指 问 这 块 内 存 空 间 所 在 的 位 置 ， 通 过 对 a 
i 比如 a=5 这 个 操作 即 可 将 a 指向 的 内 存 
空间 的 值 改 为 5。 


之 所 以 叫 “ 变 ” 量 ， 是 因为 它 表 示 的 是 内 存 中 的 位 置 ， 这 个 位 置 存 
放 的 值 是 可 以 变化 的 。 


虽然 变量 的 值 是 可 以 变化 的 ， 但 变量 的 名 字 是 不 变 的 ， 这 个 名 字 
应 该 代表 程序 员 心 目 中 这 块 内 存 空间 的 意义 ， 这 个 意义 应 该 是 不 变 
的 。 比 如 ， 变 量 int second 表 示 时 钟 秒 数 ， 在 不 同时 间 可 以 被 赋予 不 同 
的 值 ， 但 它 表 示 的 始终 是 时 钟 秒 数 。 之 所 以 说 应 该 ， 是 因为 这 不 是 必 
Ee 计算 机 也 拿 你 
没 办 法 。 


重要 的 话 再 说 一 裔 ! 变量 殉 是 给 数据 起 名 字 ， 方 便 找 不 同 的 数 
据 ， 它 的 值 可 以 变 ， 但 含义 不 应 变 。 再 比如 说 一 个 合同 ， 可 以 有 4 个 


恒 . 
变量 : 


人 | 


first_party: 合 义 是 甲 方 ; 

“second_party: 含义 是 乙方 ; 

:contract_body: 含义 是 合同 内 容 ; 

:contract_sign_date: 含义 是 合同 签署 日 期 。 

这 些 变 量 表示 的 含义 古 确定 的 ， 但 对 不 同 的 合同 ， 它们 的 值 是 不 
同 的 。 初 学 编程 的 人 经 常 使 用 像 a、b、c、hehe、haha 这 种 无 意义 的 名 
字 。 在 此 建议 为 变量 起 一 个 有 意义 的 名 字 吧 ! 通过 声明 变量 ， 每 个 变 


量 赋予 一 个 数据 类 型 和 一 个 有 意义 的 名 字 ， 我 们 束 告 诉 了 计算 机 要 操 
作 的 数据 。 


有 了 数据 ， 如 何 对 数据 进行 操作 呢 ? 我 们 先 来 看 对 数据 能 做 的 第 
一 个 操作 : 赋值 。 


1.2 ”赋值 


声明 变量 之 后 ， 束 在 内 存 分配 了 一 块 位 萤 ， 但 这 个 位 置 的 内 容 是 
未 知 的 ， 赋值 束 是 把 这 块 位 置 的 内 容 设 为 一 个 确定 的 值 。Java 中 基本 类 
型 、 数 组 、 ee 本 市 介 绍 基本 类 型 和 数组 的 赋 
值 ， 对 象 的 赋值 第 3 章 再 介 


1.2.1 基本 类 型 


(1) 整数 类 型 


整数 类 型 有 byte 、short 、int 和 long， 分 别 占 1、2、4、8 个 字 节 ， 取 
全 范围 如 表 1-1 所 示 。 


表 1-1 整数 类 型 和 取 值 范围 


-2^31~~2^(31-1) 


我 们 用 ^ 表 示 指 数 ，2^7 即 2 的 7 次 方 。 De 
么 清楚 ， 有 个 大 概 范围 认识 就 可 以 了 。 洛 尝 会 人 二 进 制 的 角度 进 
分 析 表 示范 围 为 什么 会 是 这 样 的 。 


赋值 形式 很 简单 ， 直 接 把 熟悉 的 数字 常量 形式 赋值 给 
对 应 的 内 存 空间 的 值 束 从 未 知 变 成 了 确定 的 肖 量 。 但 徊 量 
应 类 型 的 表示 范围 。 例 如 : 


变量 即 可 ， 
不 能 超过 对 


byte b = 23; 
Short s = 3333,; 
int i = 9999， 
long 1 = 32323; 


但 是 ， 在 给 long 类 型 赋值 时 ， 如 果 常 量 超过 了 int 的 表示 范围 ， 需 要 
在 常量 后 面 加 大 写 或 小 写字 母 L， 即 LL 或 1， 例 如 : 


long a = 3232343433L 


之 所 以 需要 加 L 或 |， 是 因为 数字 常量 默认 为 是 int 类 型 。 
(2) 小 数 类 型 


小 数 类 型 有 float 和 double， 占 用 的 内 存 空间 分 别 是 4 和 8 字 广 ， 有 不 
0 double 表 示 的 范围 更 大 ， 精 度 更 高 ， 具 体 如 表 1- 
2 用 不 。 

表 1-2 小数 类 型 和 取 值 范围 


类 型 名 范 类 型 名 取 值 范围 
ee -本 一 3 和 4 di 4.9E-324~1.7E+308 
3.4E+38 一 -1.4E-45 ee -1.7E+308 一 -4.9E-324 


取 值 范围 看 上 去 很 奇怪 ， 一 般 也 不 需要 记 住 ， 有 个 大 概 印象 就 可 
以 了 。E 表 示 以 10 为 底 的 指数 ，E 后 面 的 + 号 和 -号 代表 正 指 数 和 负 指 
数 ， 例 如 : 1.4E-45 表 示 1.4 乘 以 10 的 -45 次 方 。 第 2 章 会 进一步 分 析 小 数 
的 二 进 制 表示 。 


对 于 double， 直 接 把 熟悉 的 小 数 表示 赋值 给 变量 即 可 ， 例 如 ; 


double d = 333.33; 
但 对 于 float， 需 要 在 数字 后 面 加 大 写字 母 F 或 小 写字 母 f， 例 如 ; 
float f = 333.33f; 
这 是 由 于 小 数 间 量 默认 是 double 类 型 。 
除了 小 数 ， 也 可 以 把 整数 直接 赋值 给 foat 或 double， 例 如 : 


float f = 33; 
double d = 3333333333333L 


(3) 真 假 类 型 


真 假 (boolean) 类 型 很 简单 ， 直 接 使 用 true 或 false 赋 值 ， 分 别 表示 
真 和 假 ， 例 如 : 


boolean b = true; 
b = false; 


字符 类 型 char 用 于 表示 一 个 字符 ， 这 个 字符 可 以 是 中 文字 符 ， 也 可 
以 是 英文 字符 ，char 占 用 的 内 存 空间 十 两 个 字 广 。 峰 值 时 把 常量 字符 用 
单 引号 括 起 来 ， 不 要 使 用 双 引 号 ， 例 如 : 


大 部 分 的 常用 字符 用 一 个 char 就 可 以 表示 ， 但 有 的 特殊 字符 用 一 个 
0 
少 符 释 。 


前 面 介绍 的 赋值 都 是 直接 给 变量 设置 一 个 常量 值 ， 但 也 可 以 把 变 


量 赋 给 变量 ， 例 如 : 


int a = 100; 
int b = a; 


变量 可 以 进行 各 种 运算 (1.3 市 介绍 ) ， 也 可 以 将 变量 的 运算 结 
赋 给 变量 ， 例 如 ; 


*a+b; //2 乘 以 a 的 值 再 加 上 b 的 值 赋 给 c 


前 面 介绍 的 赋值 都 古 在 声明 变量 的 时 候 束 进行 了 赋值 ， 但 这 不 是 
必需 的 ， 可 以 先 声明 变量 ， 随 后 再 进行 赋值 。 


1.2.2 ”数组 类 型 
基本 类 型 的 数组 有 3 种 赋值 形式 ， 如 下 所 示 : 


int[] arr = = {1, 2,3}; 

int[] arr = new int[]{1, 2,3}; 
int[] arr = new int[3]; 
arr[0]=1; a arr[2]=3; 


ODP 


第 1 种 和 人 第 2 种 都 是 预先 知道 数组 的 内 容 ， 而 第 3 种 是 先 4 
然后 再 给 每 个 元 素 赋 值 。 第 3 种 形式 中 ， 即 使 没有 给 每 个 元 丸 赋 值 ， 
个 元 素 也 都 有 一 个 默认 值 ， 这 个 默认 值 跟 数组 类 型 有 天 ， 数值 关 型 的 ， 
值 为 0，boolean 为 false，char 为 空 字符 。 


数组 长 度 可 以 动态 确定 ， 如 下 所 示 : 


int length = = ,,.， ;7V// 根 据 一 些 条 件 动态 计算 
int arr = new int[length]; 


数组 长 度 虽 然 可 以 动态 确定 ， 但 定 了 之 后 就 不 可 以 变 。 数 组 有 一 
个 length 属 性 ， 但 只 能 读 ， 不 能 改 。 还 有 一 个 小 细 广 ， 不 能 在 给 定 初始 
值 的 同时 给 定 长 度 ， 即 如 下 格式 是 不 允许 的 : 


int[] arr = new int[3]{1,2,3} 


可 以 这 么 理解 ， 因 为 初始 值 已 经 决定 了 长 度 ， 再 给 个 长 度 ， 如 果 
还 不 一 数 ， 计 得 届 符 无 所 适 从 * 


数组 类 型 和 基本 类 型 是 有 明显 不 同 的 ， 一 个 基本 类 型 变量 ， 内 存 
中 只 会 有 一 块 对 应 的 内 存 空间 。 但 数组 有 两 块 : 二 肝 用 于 存储 数组 内 
容 本 身 ， 另 一 块 用 于 存储 内 容 的 位 置 。 用 一 个 例子 来 说 明 ， 有 一 个 int 
变量 a， 以 及 一 个 int 数 组 变量 arr， 其 代码 、 变 量 对 应 的 内 存 地 址 和 内 存 
内 容 如 表 1-3 所 示 。 


表 1-3 ”变量 对 应 的 内 存 地 址 和 内 容 


代 码 内 存 地 址 内 存 数 据 


3000 1 
int[] arr = {1,2,3}; 
3004 2 
3008 


基本 类 型 的 内 存 地 址 是 1000， 这 个 位 置 存 储 的 就 是 它 的 值 100 。 
数组 类 型 arr 的 内 存 地 址 是 2000， 这 个 位 置 存储 的 值 是 一 个 位 置 3000， 
3000 开 始 的 位 置 存储 的 才 是 实际 的 数据 “1，2，3”。 


为 什么 数组 要 用 两 块 空间 ? 不 能 只 用 一 块 空 间 吗 ? 我 们 来 看 下 面 
这 上 段 代 码 : 


int[] arrA = {1,2,3}; 
int[] arrB = {4,5,6,7}; 
arrA = arrB; 


这 段 代 码 中 ，arrA 初 始 的 长 度 是 3，arrB 的 长 度 是 4， 后 来 将 arrB 的 
值 赋 给 了 arrA。 如 果 arrA 对 应 的 内 存 空 间 是 直接 存储 的 数组 内 容 ， 那 么 
它 将 没有 足够 的 空间 去 容纳 arrB 的 所 有 元 素 。 


用 两 块 空间 存储 就 简单 得 多 ，arrA 存 储 的 值 就 变 成 了 和 arrB 的 一 
样 ， 存 储 的 都 是 数组 内 容 {4，5，6，7} 的 地 址 ， 此 后 访问 arA 就 和 arrB 
征 一 样 的 了 ， 而 arrA{1，2，3} 的 内 存 空 间 由 于 不 再 被 引用 会 进行 垃圾 
回收 ， 如 下 所 示 : 


arrA {1,2,3} 
\ 


\ 
arrB -> {4,5,6,7} 


由 上 也 可 以 看 出 ， 给 数组 变量 赋值 和 给 数组 中 元 素 赋 值 是 两 回 
事 ， 给 数组 中 元 聚 赋值 是 改变 数组 内 容 ， 而 给 数组 杰 量 赋值 则 会 让 变 
量 指向 一 个 不 同 的 位 置 。 


上 面 我 们 说 数组 的 长 度 是 不 可 以 变 的 ,不 可 变 指 的 是 数组 的 内 容 
空间 ， 一 经 分 配 ， 长 度 束 不 能 再 灾 了 ， 但 可 以 改变 数组 变量 的 值 ， 让 


它 指 向 一 个 长 度 不 同 的 空间 ， 束 像 上 例 中 arrA 后 来 指向 了 arrB 一 样 。 


给 变量 赋值 就 是 将 变量 对 应 的 内 存 空间 设置 为 一 个 明确 的 值 ， 有 
了 值 之 后 ， 变 量 可 以 被 加 载 到 CPU，CPU 可 以 对 这 些 值 进行 各 种 运 
算 ， 运 算 后 的 结果 又 可 以 被 赋值 给 变量 ， 保 存 到 内 存 中 。 数 据 可 以 进 
行 哪些 运算 ? 如 何 进行 运算 呢 ? 我 们 下 和 介绍 。 


1.3 ”基本 运算 


有 了 初始 值 之 后 ， 可 以 对 数据 进行 运算 。 运 算 有 不 同 的 类 型 ， 不 
同 的 数据 类 型 支持 的 运算 也 不 一 样 ， 本 市 介绍 Java 中 基本 类 型 数据 的 主 
要 运算 。 

算术 运算 : 主要 古 日 前 的 加 减 乘除 。 

-比较 运算 : 主要 是 日 常 的 大 小 比较 。 

逻辑 运算 : 针对 布尔 值 进行 运算 。 


[3 了 算术 运算 


算术 运算 特有 加 、 减 、 乘 、 除 ， 符 号 分 别 是 +、-、*、/， 男 外 还 有 
取 模 运算 符 %， 以 及 自 增 (++) 和 有 自 减 (--) 运算 符 。 取 模 运 算 适 用 于 
整数 和 字符 类 型 ， 其 他 算术 运算 适用 于 所 有 数值 类 型 和 字符 类 型 。 大 
部 分 运算 都 符合 我 们 的 数学 常识 ， 但 字符 怎么 也 可 以 进行 算术 运算 ? 
我 们 到 2.4 节 再 解释 。 

减 号 〈-) 通常 用 于 两 个 数 相 减 ， 但 也 可 以 放 在 一 个 数 前 面 ， 例 如 - 
a， 这 表示 改变 a 的 符号 ， 原 来 的 正 数 会 变 为 负数 ， 原 来 的 负数 会 变 为 
正 数 ， 这 也 是 符合 我 们 常识 的 。 

取 模 (%) 就 是 数学 中 的 求 余 数 ， 例 如 ，5%3 是 2，10%5 是 0。 


自 增 (++) 和 自 减 (--) ， 是 一 种 快捷 方式 ， 是 对 自己 进行 加 1 或 
减 1 操作 。 

加 、 减 、 乘 、 除 大 部 分 情况 和 数学 运算 是 一 样 的 ， 都 很 容易 理 
oe 一 些 需 要 注意 的 地 方 ， 而 自 增 、 自 减 稍微 复 杂 一 些 ， 下 面 我 
门 解释 下。 


1. 加 、 减 、 乘 、 除 注意 事项 


运算 时 要 注意 结果 的 范围 ， 使 用 恰当 的 数据 类 型 。 两 个 正 数 都 可 
| 但 相 乘 的 结果 可 能 融会 超出 ， 超 出 后 结 采 会 令 人 困 三 ， 
列 如 : 


int a = 2147483647*2; //2147483647 是 int 能 表示 的 最 大 值 


a 的 结 琳 是 -2。 为 什么 是 -2 我 们 暂 不 解释 ， 要 避免 这 种 情况 ， 我 们 
的 结果 类 型 应 使 用 long， 但 只 改 为 long 也 是 不 够 的 ， 因 为 运算 还 是 默认 
按照 int 类 型 进行 ， 需 要 将 至 少 一 个 数据 表示 为 long 形 式 ， 即 在 后 面 加 L 
或 1， 下 面 这 样 才 会 出 现 期 望 的 结果 : 


long a = 2147483647*2L 


另外 ， 需 要 注意 的 是 ， 整 数 相 除 不 是 四 含 五 入 ， 而 是 直接 舍 去 小 
数位 ， 例 如 : 


double d = 10/4; 


结 采 是 2 而 不 是 2.5， 如 果 要 按 小 数 进行 运算 ， 需 要 将 至 少 一 个 数 表 
示 为 小 数 形式 ， 或 者 使 用 强制 类 型 转化 ， 即 在 数字 前 面 加 (double) ， 
表示 将 数字 看 作 double 类 型 ， 如 下 所 示 任 意 一 种 形式 都 可 以 : 


a) double d = 10/4.0; 
b) double d = 10/(double)4; 


2. 小 数 计算 结果 不 精确 


无 论 是 使 用 float 还 是 double， 进 行 运算 时 都 会 出 现 一 些 非 冲 令 人 困 
惑 的 现象 ， 比 如 : 


float f = 0.1f*0.1f; 
System.out.printin(f); 


这 个 结果 看 上 去 应 该 是 0.01， 但 实际 上 ， 屏 幕 输出 却 是 
0.010000001， 后 面 多 了 个 1。 换 用 double 看 看 : 


double d = 0.1* 
System.out. pe 


屏幕 输出 0.010000000000000002， 一 连 串 的 0 之 后 多 了 个 2， 结 果 也 
不 精确 。 


这 是 怎么 回 事 ? 看 上 去 这 么 简单 的 运算 ， 计 算 机 计算 的 结果 怎么 
不 精确 呢 ? 但 事实 束 是 这 样 ， 究 其 原因 ， 我 们 需要 理解 float 和 double 的 
二 进 制 表 示 ， 我 们 到 2.2 节 再 进行 分 析 。 


3. 目 增 (++) / 目 减 (--) 


自 增 / 自 减 是 对 自 0 但 每 个 都 有 两 种 形式 ， 一 种 
是 放 在 变量 后 ， 例 如 a++、a--， 另 一 种 是 放 在 变量 前 ， 例 如 ++a、--a。 


如 有 果 只 是 对 目 己 操作 ， 这 两 种 形式 也 没什么 差别 ， 区 别 在 于 还 有 
其 他 操作 的 时 候 。 放 在 变量 后 (at+) 是 先 用 原来 的 值 进 行 其 他 操作 ， 
然后 再 对 自己 做 修改 ， 而 放 在 变量 前 (++a) 是 先 对 自己 做 修改 ， 再 用 
修改 后 的 值 进行 其 他 操作 。 例 如 ， 快 捷 运 算 和 其 等 同 的 运算 如 表 1-4 所 
RR? 


表 1-4 人 快捷 运算 和 其 等 同 的 运算 
快捷 运算 等 同 运 算 
b=a++—1 
c=++a—l 
j=j+1 


arrA[i++]=arrB[++]] arrA[i]=arrB[] 


1=1+1 


目 增 / 目 减 是 “快捷 ”操作 ， 是 让 程序 员 少 写 代码 的 ， 但 遗憾 的 是 
由 于 比较 奇怪 的 语法 和 诡异 的 行为 ， 给 初学 着 带 来 了 一 些 困 惑 。 


1.3.2 ”比较 运算 


比较 运算 就 是 计算 两 个 值 之 间 的 关系 ， 结 果 是 一 个 布尔 类 型 
(boolean) 的 值 。 比 较 运算 适用 于 所 有 数值 类 型 和 字符 类 型 。 数 值 类 
型 容易 理解 ， 但 字符 怎么 比 呢 ? 我 们 到 2.4 节 再 解释 。 


比较 操作 符 有 大 于 (>) 、 大 于 等 于 (>=) 、 小 于 (<) 、 小 于 
等 于 (<=) 、 等 于 (==) 、 不 等 于 (1 =) 。 


大 部 分 也 都 是 比较 直观 的 ， 需 要 注意 的 是 等 于 。 首 先 ， 它 使 用 两 
个 等 号 ==， 而 不 是 一 个 等 号 =。 为 什么 不 用 一 个 等 号 呢 ? 因为 一 个 等 号 
= 已 经 被 占 了 ， 表 示 赋 值 操 作 。 另 外 ， 对 于 数组 ，== 判 断 的 是 两 个 变量 
指 回 的 是 不 是 同一 个 数组 ， 而 不 是 两 个 数组 的 元 丸 内 容 是 否 一 样 ， 即 
人 

false， 比 如 : 


int[] a = new int[] {1,2,3}; 
int[] b = new int[] {1,2,3}; 
//a==b 的 结果 是 false 


PR 内 容 是 否 一 样 ， 需 要 逐个 比较 里 面 存储 的 每 
广元 系 “。 
1.3.3 ”逻辑 运算 

逻辑 运算 根据 数据 的 逻辑 关系 ， 生 成 一 个 布尔 值 true 或 者 false。 逮 
辑 运 算 只 可 应 用 于 boolean 类 型 的 数据 ， 但 比较 运算 的 结果 是 布尔 值 ， 
所 以 其 他 类 型 数据 的 比较 结果 可 进行 逻辑 运算 。 


逻辑 运算 符 具体 有 以 下 这 些 。 


与 (&) : 两 个 都 为 tue 才 是 tue， 只 要 有 一 个 是 false 就 是 false; 
:或 (|) : 只 要 有 一 个 为 true 就 是 tue， 都 是 false 才 是 false; 

非 〈!1 ) : 针对 一 个 变量 ，true 会 变 成 false，false 会 变 成 true 
: 异 或 (^) : 两 个 相同 为 false， 两 个 不 相同 为 true; 

.短路 与 (&&) : 和 & 类 似 ， 不 同 之 处 稍 后 解释 ; 


-短路 或 (|) : 与 类似， 不同 之 处 稍 后 解释 。 


逻辑 运算 的 大 部 分 都 是 比较 直观 的 ， 需 要 注意 的 是 & 和 &&， 以 及 | 
和 上 | 的 区 别 。 如 琳 只 是 进行 逻辑 运算 ， 它 们 也 都 十 相同 的 ， 区 别 在 于 同 
时 有 其 他 操作 的 情况 下 ， 例 如 : 


boolean a = true; 
int b = 0; 
boolean flag = a | b++>0,; 


因为 a 为 tue， 所 以 flag 也 为 tue， 但 b 的 结果 为 1， 因 为 | 后 面 的 式 子 
也 会 进行 运算 ， 即 使 只 看 a 已 经 知道 fag 的 结 采 ， 还 是 会 进行 后 面 的 运 
算 。 而 | 则 不 同 ， 如 条 最 后 一 名 的 代码 是 : 


boolean flag = a || b++>0; 


则 b 的 值 还 是 0， 因 为 | 会 < 短路”， 即 在 看 到 | 前 面部 分 就 可 以 判定 结 
果 的 情况 下 ， 忽 略 | 后 面 的 运算 。 


134 小 结 

本 节 介 绍 了 Java 中 基本 类 型 数据 的 主要 运算 ， 包 括 算术 运算 、 比 较 
运算 和 人 逻辑 运算 。 

一 个 稍微 复杂 的 运算 可 能 会 涉及 多 个 变量 和 多 种 运算 ， 那 哪个 先 
算 ， 哪 个 后 算 呢 ? 程序 语言 规定 了 不 同 运 算 符 的 优先 级 ， 有 的 会 先 
算 ， 有 的 会 后 算 ， 大 部 分 情况 下 ， 这 个 优先 级 与 我 们 的 常识 理解 是 相 
符 的 。 但 在 一 些 复杂 情况 下 ， 我 们 可 能 会 搞 不 明白 其 运算 顺序 。 但 这 
个 我 们 不 用 太 操 心 ， 可 以 使 用 括号 () 来 表达 我 们 想 要 的 顺序 ， 括 号 
里 的 会 先进 行 运算 。 人 简单 来 说 ， 不 确定 顺序 的 时 候 ， 束 使 用 括号 。 

本 节 遗 留 了 一 些 问题 ， 比 如 ; 

. 正 整数 相 乘 的 结果 居然 出 现 了 负数 ; 

.非常 基本 的 小 数 运算 结果 居然 不 精确 ; 


字符 类 型 也 可 以 进行 算术 运算 和 比较 。 


关于 这 些 问 题 ， 我 们 到 第 2 章 再 进行 解释 。 为 了 编写 有 更 多 实用 功 
能 的 程序 ， 只 进行 基本 操作 是 远 远 不 够 的 ， 我 们 至 少 需 要 对 操作 的 过 
程 进行 流程 控制 。 流 程控 制 主要 有 两 种 : 一 种 是 条 件 执行 ， 另 外 一 种 
征 循 环 执行 ， 搂 下 来 的 两 下 对 它们 进行 详细 介绍 。 


1.4 条 件 执行 


流程 控制 中 最 基本 的 就 是 条 件 执行 ， 也 就 是 说 ， 一 些 操 作 只 能 在 
某 些 条 件 满 足 的 情况 下 才 执行 ， 在 一 些 条 件 下 执行 某 种 操作 ， 在 另外 
一 些 条 件 下 执行 另外 的 操作 。 这 与 交通 控制 中 的 红 灯 停 、 绿 灯 行 条 件 
0 。 我 们 先 来 看 Java 中 表达 条 件 执行 的 语法 ， 然 后 介绍 其 实 
现 原 理 。 


1.4.1 语法 和 陷阱 


Java 中 表达 条 件 执行 的 基本 语法 是 if 语句 ， 它 的 语法 是 : 


if( 条 件 语 句 ){ 
代码 块 


if( 条 件 语句 ) 代码 ; 


表达 的 含义 也 非常 简单 ， 只 在 条 件 语句 为 真 的 情况 下 ， 才 执行 后 
面 的 代码 ， 为 假 就 不 执行 了 。 有 具体 来 说 ， 条 件 语 名 必须 为 布尔 值 ， 可 
以 是 一 个 直接 的 布尔 变量 ， 也 可 以 是 变量 运算 后 的 结 末 。 我 们 在 1.3- 
介绍 过 ， 比 较 运算 和 逻辑 运算 的 结果 都 是 布尔 值 ， 所 以 可 作为 条 件 语 
人 句 。 条 件 语 句 为 tue， 则 执行 括号 人 中 的 代码 ， 如 采 后 面 没有 括号 ， 则 
执行 后 面 第 一 个 分 号 (; ) 前 的 代码 。 


比如 ， 只 在 变量 为 偶数 的 情况 下 输出 : 


int a=10; 
if (a%2==0){ 
System.out.println(" 偶 数 "); 


或 者 : 


int a=10; 
if(a%2==0) System.out,.printLn(" 偶 数 ") ; 


让 的 陷阱 初学 者 有 时 会 忘记 在 if 后 面 的 代码 块 中 加 括号 ， 有 时 和希 
望 执行 多 条 语句 而 没有 加 括号 ， 结 果 只 会 执行 第 一 条 语句 ， 建 议 所 有 让 
后 面部 加 括号 。 

if 实 现 的 是 条 件 满足 的 时 候 做 什么 操作 ， 如 果 需 要 根据 条 件 做 分 


支 ， 即 满足 的 时 候 执行 某 种 逻辑 ， 而 不 满足 的 时 候 执 行 男 一 种 逻辑 ， 
则 可 以 用 if/else， 语 法 是 : 


(判断 条 件 ){ 
代码 块 

}elset 
代码 块 


Dh > 


if/else 也 非常 简单 ， 判 断 条 件 是 一 个 布尔 值 ， 为 true 的 时 候 执行 代 
码 块 1， 为 假 的 时 候 执 行 代码 块 2。 


1.3 让 介绍 了 各 种 基本 运算 ， 这 里 介绍 一 个 条 件 运算 ， 和 if/else 很 
像 ， 叫 三 元 运算 符 ， 语 法 为 : 


判断 条 件 ? 表达 式 1 : ”表达 式 2 


三 元 运算 符 会 得 到 一 个 结 来 ， 判 断 条 件 为 真 的 时 候 束 返回 表达 式 1 
的 值 ， 否 则 就 返回 表达 式 2 的 值 。 三 元 运算 符 经 常用 于 对 某 个 变量 赋 
值 ， 例 如 求 两 个 数 的 最 大 值 : 


Int max =x>y?x:y; 
三 元 运算 符 完全 可 以 用 ifelse 代 替 ， 但 三 元 运算 符 的 书写 方式 更 简 
滞 。 


如 果 有 多 个 判断 条 件 ， 而 且 需 要 根据 这 些 判断 条 件 的 组 合 执行 某 
些 操作 ， 则 可 以 使 用 ielse if/else， 语 法 是 : 


if( 条 件 1){ 

代码 块 1 

}else if( 条 件 2 
代码 块 2 


else if( 条 件 n){ 
代码 块 n 

}elsef{ 

代码 块 n+1 


if/else if/else 也 比较 简单 ， 但 可 以 表达 复杂 的 条 件 执 行 逻辑 ， 它 逐 
个 检查 条 件 ， 条 件 1 满 足 则 执行 代码 块 1， 不 满足 则 检查 条 件 2，.…………， 
最 后 如 果 没 有 条 件 满足 ， 且 有 else 语 句 ， 则 执行 else 里 面 的 代码 。 最 后 
的 else 语 句 不 是 必需 的 ， 没 有 束 什 么 都 不 执行 。 


if/else igelse 陷 阱 : 需要 注意 的 是 ， 在 if/else itgelse 中 ， 判 断 的 顺序 
是 很 重要 的 ， 后 面 的 判断 只 有 在 前 面 的 条 件 为 false 的 时 候 才 会 执行 。 


初学 者 有 时 会 搞 错 这 个 顺序 ， 如 下 面 的 代码 : 


If(Score>60){ 
return "及 格 "， 

}else if(score>80){ 
return "良好 "， 

}elsef{ 
return "优秀 " 


} 


了 


看 出 问题 了 吧 ? 如 果 score 是 90， 可 能 期 望 返回 “优秀 ”， 但 实际 只 
会 返回 “及 格 ”。 


在 if/else ifyelse 中 ， 如 果 判 断 的 条 件 基 于 的 是 同一 个 变量 ， 只 是 根 
据 变 量 值 的 不 同 而 有 不 同 的 分 支 ， 如 果 值 比较 多 ， 比 如 根据 星期 几 进 
行 判 断 ， 有 7 种 可 能 性 ， 或 者 根据 更 文字 母 进行 判断 ， 有 26 种 可 能 性 ， 
使 用 if/else if/else 比 较 烦 琐 ， 这 种 情况 可 以 使 用 switch， 语 法 是 : 


switch( 表 达 式 ){ 
case 值 1: 
代码 1; break; 
case 值 2: 
代码 2; break; 


case 值 n: 
代码 n; break; 


default: 代码 n+1 


switch 也 比较 简单 ， 根 据 表 达 式 的 值 执 行 不 同 的 分 支 ， 具 体 来 说 ， 
根据 表达 式 的 值 找 匹配 的 case， 找 到 后 执行 后 面 的 代码 ， 人 页 到 break 时 
结束 ， 如 有 果 没 有 找到 匹配 的 值 则 执行 default 后 的 语句 。 表 达 式 值 的 数据 
类 型 只 能 是 byte、short、int、char、 枚 举 和 String (Java 7 以 后 ) 。 枚 举 
和 String 我 们 在 后 续 章 节 介绍 。 


switch 会 简化 一 些 代码 的 编写 ， 但 break 和 case 语 法 会 给 初学 者 造成 
一 些 困 惑 。 


break 是 指 跳出 switch 语 句 ， 执 行 switch 后 面 的 语句 。 每 条 case 语 句 
后 面 都 应 该 跟 break 语 句 ， 否 则 会 继续 执行 后 面 case 中 的 代码 直到 页 到 
break 语 句 或 switch 结 束 。 比 如 ， 下 面 的 代码 会 输出 所 有 数字 而 不 只 是 
1 O 


int a = 1; 

switch(a)t{ 

case 1: 
System.out.println("1"); 

case 2: 
System.out.println("2"); 

default: 
System.out.println("3"); 


case 语 句 后 面 可 以 没有 要 执行 的 代码 ， 如 下 所 示 : 


char c = 'A'; // 某 字符 
switch(c)f{ 

case 'A': 

case 'B': 

case 'C': 
System.out.println("A-2Z");break; 
case 'D': 


case'AVB' 后 都 没有 紧 跟 要 执行 的 代码 ， 它 们 实际 会 执行 第 一 块 伴 
到 的 代码 ， 即 case'C' 匹 配 的 代码 。 


简单 总 结 下 ， 条 件 执行 总 体 上 走 比 较 商 单 的 : 单一 条 件 满足 时 ， 
执行 某 操作 便 用 if， 根 据 一 个 条 件 是 个 满足 执行 不 同 分 文 使 用 ifyelse; 
表达 复杂 的 条 件 使 用 ifyelse if/else; 条 件 赋 值 使 用 三 元 运算 符 ， 根 据 某 
一 个 表达 式 的 值 不 同 执行 不 同 的 分 支 使 用 switch 。 


从 逻辑 上 讲 ，if/else、if/else iffelse、 三 元 运算 符 、switch 都 可 以 只 


用 if 代 蔡 ， 但 使 用 不 同 的 语法 表达 更 和 侧 污 ， 在 条 件 比 较 多 的 时 候 ， 
switch 从 性 能 上 看 也 更 高 ( 稍 后 解释 原因 ) 。 


1.4.2 ”实现 原理 


条 件 执行 具体 是 怎么 实现 的 呢 ? 程序 最 终 都 是 一 条 条 的 指令 ， 
CPU 有 一 个 指令 指示 器 ， 指 向 下 一 条 要 执行 的 指令 ，CPU 根 据 指 示 咒 
的 指示 加 载 指 令 并 且 执 行 。 指 令 大 部 分 是 具体 的 操作 和 运算 ， 在 执行 
这 些 操作 时 ， 执 行 完 一 个 操作 后 ， 指 令 指 示 屁 会 目 动 指向 挨 着 的 下 一 


马 和 人 
条 入 仿 * 


但 有 一 些 符 殊 的 指令 ， 称 为 跳 转 指令， 这 些 指 令 会 修改 指令 指示 
旨 的 值 ， 让 CPU 踏 到 一 个 指定 的 地 方 执行 。 跳 你 有 两 种 : 一 种 是 条 件 
跳 转 ; 另 一 种 是 无 条 件 跳 转 。 条 件 跳 转 检查 某 个 条 件 ， 满 足 则 进行 跳 
加 ， 无 条 件 跳 转 则 是 直接 进行 跳 园 。 


if/else 实 际 上 会 转换 为 这 些 跳 转 指令 ， 比 如 下 面 的 代码 : 


1 int a=10; 
if(a%2==0) 


System.out .println(" 偶 数 ") ; 


2 
3 
4 
5 
6 // 其 他 代码 


{ 
上 
/ 


转换 到 的 转移 指令 可 能 是 : 


2 条 件 跳 转 ， 如 果 a%2==0，, 跳 转 到 第 4 行 
3 无 条 件 跳 转 ， 跳 转 到 第 7 行 


System.out.println(" 偶 数 ") ; 


/其 他 代码 


你 可 能 会 奇怪 第 3 行 的 无 条 件 跳 转 指 令 ， 没 有 它 不 行 吗 ? 不 行 ， 没 
有 这 条 指令 ， 它 会 顺序 执行 接 下 来 的 指令 ， 叶 致 不 管 什么 条 件 ， 插 号 
中 的 代码 都 会 执行 。 不 过 ， 对 应 的 跳 转 指 令 也 可 能 是 : 


t a=10; 
条 件 跳 转 : 如 果 a%21=0，, 跳 转 到 第 6 行 


System.out.println(" 偶 数 ") ; 


1 
2 
3 
4 
5 
6 // 其 他 代码 


这 里 就 没有 无 条 件 跳 转 指令 ， 具 体 怎 么 对 应 和 编译 强 实 现 有 关 。 
在 单一 if 的 情况 下 可 能 不 用 无 条 件 跳 转 指令 ， 但 稍微 复 洒 一 些 的 情况 都 
需要 。if、if/else、if/else ifgfelse、 三 元 运算 符 都 会 转换 为 条 件 跳 转 和 无 
条 件 跳 转 ， 但 switch 不 太一 样 。 


switch 的 转换 和 具体 系统 实现 有 关 。 如 采 分 文 比 较 少 ， 可 能 会 较 换 
为 跳 转 指令 。 如 来 分 支 比较 多 ， 使 用 条 件 跳 转 会 进行 很 多 次 的 比较 运 
算 ， 效 率 比较 低 ， 可 能 会 使 用 一 种 更 为 高 效 的 方式 ， 叫 跳 转 表 。 跳 转 
表 是 一 个 映射 表 ， 存 储 了 可 能 的 值 以 及 要 跳 拉 到 的 地 址 ， 如 表 1-5 所 
RR? 


表 1-5” 跳 转 表 
条 件 值 跳 转 地 址 条 件 值 跳 转 地 址 
值 2 代码 块 2 的 地 址 条 7 代码 块 n 的 地 址 


跳 转 表 为 什么 会 更 为 高 效 呢 ? 因为 其 中 的 值 必须 为 整数 ， 且 按 大 
小 顺序 排序 。 按 大 小 排序 的 整数 可 以 使 用 高 效 的 二 分 查找 ， 即 先 与 中 
间 的 值 比 ， 如 琳 小 于 中 间 的 值 ， 则 在 开始 和 中 间 值 之 间 找 ， 否 则 在 中 
间 值 和 末尾 值 之 间 找 ， 每 找 一 次 缩小 一 半 查 找 范围 。 如 有 果 值 是 连续 
的 ， 则 跳 转 表 还 会 进行 特殊 优化 ， 优 化 为 一 个 数组 ， 连 找 都 不 用 找 
了 ， 值 束 古 数组 的 下 标 索 引 ， 直 接 根 据 值 就 可 以 找到 跳 转 的 地 址 。 即 
使 值 不 是 连续 的 ， 但 数字 比较 密集 ， 老 的 不 多 ， 编 译 志 也 可 能 会 优化 
为 一 个 数组 型 的 跳 转 表 ， 没 有 的 值 指 同 default 分 支 。 


程序 源 代码 中 的 case 值 排列 不 要 求 是 排序 的 ， 编 译 侨 会 自动 排序 。 
之 前 说 switch 值 的 类 型 可 以 是 byte、short、int、char、 枚 举 和 String。 其 
中 byte/shorUint 本 来 就 是 整数 ，char 本 质 上 也 是 整数 (2.4 节 介绍 ) ， 而 


枚 举 类 型 也 有 对 应 的 整数 (5.4 节 介绍 ，String 用 于 switch 时 也 会 转换 
为 整数 。 不 可 以 使 用 long， 为 什么 呢 ? 跳 转 表 值 的 存储 空间 一 般 为 32 

位 ， 容 纳 不 下 long。 简 单 说 明 下 String，String 是 通过 hashCode 方 法 (7.2 
节 介 绍 ) 转换 为 整数 的 ， 但 不 同 String 的 hashCode 可 能 相同 ， 跳 转 后 会 
再 次 根据 String 的 内 容 进 行 比较 判断 。 


简单 总 结 下 ， 条 件 执行 的 语法 是 比较 自然 和 容易 理解 的 ， 需 要 注 

章 的 是 其 中 的 一 些 语 法 细 世 和 陷阱 。 它 执行 的 本 质 依赖 于 条 件 跌 转 、 

无 条 件 跳 转 和 跳 转 表 。 条 件 执行 中 的 跳 转 只 会 跳 转 到 跳 转 语句 以 后 的 
和 令 ， 能 不 能 跳 转 到 之 前 的 指令 呢 ? 可以， 那样 束 会 形成 循环 。 


1.5 循环 


所 谓 循 环 ， 就 是 多 次 重复 执行 某 些 类 似 的 操作 ， 这 个 操作 一 般 不 
0 
多 了 ， 比 如 : 


1) 展示 照片 ， 我 们 查看 手机 上 的 照片 ， 背 后 的 程序 需要 将 照片 一 
张 张 展示 给 我 们 。 


0 
万 o 
本 
给 我 们 。 


循环 除了 用 于 重复 读 取 或 展示 某 个 列表 中 的 内 容 ， 日 前 中 的 很 多 
操作 也 要 靠 循环 完成 ， 比 如 : 


1) 在 文件 中 ， 查 找 某 个 词 ， 程 序 需要 和 文件 中 的 词 逐 个 比较 〈 当 
然 可 能 有 更 高 效 的 方式 ， 但 也 离 不 开 循环 ) ，; 


2) 使 用 Excel 对 数据 进行 汇总 ， 比 如 求 和 或 平均 值 ， 需 要 循环 处 
理 每 个 单元 的 数据 ; 


3) 群发 祝福 消息 给 好 友 ， 程 序 需 要 循环 给 每 个 好 友 发 。 


当然 ， 以 上 这 些 例子 只 有 古 冰山 一 角 。 计 算 机 程序 运行 时 大 致 只 能 
顺序 执行 、 条 件 执行 和 循环 执行 。 顺序 和 条 件 其 实 没什么 特别 的 ， 而 
循环 大 概 才 是 程序 强大 的 地 方 。 和 攒 借 循环 ， 计 算 机 能 够 非常 高 效 地 完 
成 人 很 难 或 无 法 完成 的 事情 。 比 如 ， 在 大 量 文件 中 查找 包含 某 个 搜索 
词 的 文档 ， 对 几 十 万 条 销售 数据 进行 统计 让 总 等 。 下 面 ， 我 们 先 来 介 


1.5.1 循环 的 4 种 形式 


在 Java 中 ， 循 环 有 4 种 形式 ， 分 别 是 while、do/while、for 和 
foreach， 下 面 我 们 分 别 介 绍 。 


1.while 
while 的 语法 为 : 
while 的 语法 为 : 
while( 条 件 语句 ){ 
代码 块 
} 
或 : 


while( 条 件 语句 ) 代码 ， 


while 和 的 语法 很 像 ， 只 是 把 if 换 成 了 while， 它 表达 的 含义 也 非 
Ea 束 一 直 执 行 后 面 的 代码 ， 为 假 就 停止 不 
°。 比如 : 


Scanner reader = new Scanner(System.in); 
System.out.println("please input password"); 
int num = reader.nextInt(); 
int password = 6789; 
while(num!=password)t{ 
System,.out.println("please input password"),; 
num = reader.nextInt(); 


} 
System.out.println("correct"); 
reader .close(); 


以 上 代码 中 ， 我 们 使 用 类 型 为 Scanner 的 reader 变 量 从 屏幕 控制 台 
接收 数字 ，readernextInt () 从 屏 尹 接收 一 个 数字 ， 如 果 数 字 不 是 
6789， 束 一 直 提 示 输 入 ， 否 则 跳出 循环 。 以 上 代码 中 的 Scanner 我 们 会 
在 13.3 世 介绍 ， 目 前 可 以 忽略 其 细节 。 


while 循 环 中 ， 代 码 块 中 会 有 影响 循环 中 断 或 退出 的 条 件 ， 但 经 利 
不 知道 什么 时 候 循 环 会 中 断 或 退出 。 比 如 ， 上 例 中 在 匹配 的 时 候 会 退 
出 ， 但 什么 时 候 能 匹配 取决 于 用 户 的 输入 。 


2.do/while 


如 果 不 管 条 件 语句 是 什么 ， 代 码 块 都 会 至 少 执 行 一 次 ， 则 可 以 使 
用 do/while 循 环 ， 其 语法 为 : 


dof{ 


代码 块 ; 
}while( 条 件 语句 ) 


这 个 也 很 容易 理解 ， 先 执行 代码 块 ， 然 后 再 判断 条 件 语句 ， 如 果 
成 立 ， 则 继续 循环 ， 否 则 退出 循环 。 也 束 是 谤 ， 不 管 条 件 语句 征 什 
Re 


Scanner reader = new Scanner(System.in); 
int password = 6789 
int num = 0; 
dof{ 
System.out.println("please input password"),; 
num = reader.nextInt(); 
}while(num!=password); 
System.out.println("correct"); 
reader .close(); 


3.for 


实际 中 应 用 最 为 广泛 的 循环 语法 可 能 是 for 了 ， 尤 其 是 在 循环 次 数 
己 知 的 情况 。 其 语法 为 : 


for (初始 化 语句 ;循环 条 件 ;， 步 进 操作 ){ 
循环 体 
} 


for 后 面 的 括号 中 有 两 个 分 号 ; ， 分 阳 了 三 条 语句 。 除 了 循环 条 件 
必须 返回 一 个 boolean 类 型 外 ， 其 他 语句 没有 什么 要 求 ， 但 通常 情况 下 
第 一 条 语句 用 于 初始 化 ， 尤 其 是 循环 的 索引 变量 ， 第 三 条 语句 修改 循 
ee 
行 J 语 ° 


for 循 环 简化 了 书写 ， 但 执行 过 程 对 初学 者 而 言 不 是 那么 明显 ， 实 
际 上 ， 它 执行 的 流程 如 下 : 


1) 执行 初始 化 指令 ; 

2) 检查 循环 条 件 是 否 为 tue， 如 果 为 false， 则 跳 转 到 第 6 步 ; 
3) 循环 条 件 为 真 ， 执 行 循环 体 ; 

4) 执行 步 进 操作 ; 

5) 步 进 操作 执行 完 后 ， 跳 转 到 第 2 步 ， 即 继续 检查 循环 条 件 ; 
6) for 循 环 后 面 的 语句 。 

下 面 古 一 个 人 简单 的 for 循 环 : 


int[] arr = {1,2,3,4}; 

for(int i=0; i<arr.length; i++){ 
System.out.printlin(arr[i]); 

} 


顺序 打印 数组 中 的 每 个 元 隶 ， 初 始 化 语句 初始 化 索引 ji 为 0， 循 环 
条 件 为 索引 小 于 数组 长 度 ， 步 进 操作 为 递增 索引 ii， 循环 体 打印 数组 元 


局 、 


在 for 中 ， 每 条 语句 都 是 可 以 为 空 的 ， 也 就 是 说 : 
for(;;) 0 


征 有 效 的 ， 这 有 是 个 死 循 环 ， 一 直 在 空转 ， 和 while (true) 了 介 的 效 
果 是 一 样 的 。 可 以 省 略 某 些 语 句 ， 但 分 号 ; 不 能 省 。 如 : 


int[] arr = {1,2,3,4}; 

int i=0; 

for(; i<arr.length; i++){ 
System.out.printlin(arr[i]); 


索引 变量 在 外 面 初始 化 了 ， 所 以 初始 化 语句 可 以 为 空 。 
4.foreach 


foreach 的 语法 如 下 所 示 : 


int[] arr = {1,2,3,4}; 
for(int element : arr){ 
System.out.println(element); 


foreach 不 是 一 个 关键 字 ， 它 使 用 冒号 : ， 冒 号 前 面 是 循环 中 的 每 
个 元 素 ， 包 括 数据 类 型 和 变量 名 称 ， 冒 号 后 面 是 要 所 历 的 数组 或 集合 
(第 9 章 介 绍 ) ， 每 次 循环 element 都 会 自动 更 新 。 对 于 不 需要 使 用 索 
引 变 量 ， 只 是 简单 表 历 的 情况 ，foreach 语 法 上 更 为 简洁 。 


1.5.2 ”循环 控制 


在 循环 的 时 候 ， 会 以 循环 条 件 作 为 是 否 结束 的 依据 ， 但 有 时 可 能 
会 需要 根据 别 的 条 件 提 前 结束 循环 或 跳 过 一 些 代 码 ， 这 时 可 以 使 用 
break 或 continue 关 键 字 对 循环 进行 控制 。 


1.break 


break 用 于 提前 结束 循环 。 比如 ， 在 一 个 数组 中 查找 某 个 元 素 的 时 
候 ， 循 环 条 件 可 能 是 到 数组 结束 ， 但 如 有 果 找 到 了 元 素 ， 可 能 驶 会 想 提 
前 结束 循环 ， 这 时 就 可 以 使 用 break。 


我 们 在 介绍 switch 的 时 候 提 到 过 break， 它 用 于 跳 转 到 switch 外 面 。 
在 循环 的 循环 体 中 也 可 以 使 用 break， 它 的 含义 和 switch 中 的 类 似 ， 用 
于 跳出 循环 ， 开 始 执行 循环 后 面 的 语句 。 以 在 数组 中 查找 元 素 作 为 例 
子 ， 代 码 可 能 是 : 


int[] arr = .，; // 在 该 数组 中 查找 元 素 
int toSearch = 100; // 要 查找 的 元 素 
int i = 0; 


了 
for(; i<arr.length; i++){ 
if(arr[i]==toSearch)t{ 
break; 


} 

if(i!=arr.length)t{ 
System.out.println("found"); 

}elsef{ 

System.out.printjn("not found"); 


如 果 找 到 了 ， 会 调用 break，break 执 行 后 会 跳 转 到 循环 外 面 ， 不 会 
再 执行 i++ 语 句 ， 所 以 即使 是 最 后 一 个 元 素 匹 瑟 ，i 也 小 于 arr.length， 而 
如 果 没 有 找到 ，i 最 后 会 变 为 arr.length， 所 以 可 根据 i 是 否 等 于 arr.length 
来 判断 是 否 找 到 了 。 以 上 代码 中 ， 也 可 以 将 判断 是 否 找到 的 检验 放 到 
循环 条 < 件 中 ， 但 通常 情况 下 ， 使 用 break 会 使 代码 更 清楚 一 些 。 


2.COntinue 


在 循环 的 过 程 中 ， 有 的 代码 可 能 不 需要 每 次 循环 都 执行 ， 这 时 
候 ， 可 以 使 用 continue 语 句 ，continue 语 名 会 跳 过 循环 体 中 剩 下 的 代 
码 ， 然 后 执行 步 进 操作 。 我 们 看 个 例子 ， 以 下 代码 统计 一 个 数组 中 某 
个 元 素 的 个 数 : 


int[] arr = . // 在 该 数组 中 查找 元 素 
int toSearch = 2; // 要 查找 的 元 素 
int count = 0; 
for(int i=0; i<arr.length; i++){ 
if(arr[i]!=toSearch)t{ 
continue; 


count++; 


System.out.println("found count "+Count ) ， 


上 面 的 代码 统计 数组 中 值 等 于 toSearch 的 元 素 个 数 ， 如 采 值 不 等 于 
toSearch， 则 路 过 剩 下 的 循环 代码 ， 执 行 计 +。 以 上 代码 也 可 以 不 用 
continue， 使 用 相反 的 站 判断 也 可 以 得 到 相同 的 结果 。 这 只 是 个 人 偏好 
的 问题 ， 如 果 类 似 要 跳 过 的 情况 比较 多 ， 使 用 continue 可 能 会 更 易 读 。 


1.5.3 ”实现 原理 


和 让 一 样 ， 循 环 内 部 也 是 靠 条 件 转 移 和 无 条 件 转移 指令 实现 的 ， 
比如 下 面 的 代码 : 


int[] arr = {1,2,3,4}; 
for(int i=0; i<arr.length; i++){ 
System.out.printlin(arr[i]); 


} 
其 对 应 的 跳 轩 过程 可 能 大 


1 int[] arr = {1,2,3,4}; 

2 int i=0; 

3 条 件 跳 转 ， 如 果 i>=arr .length， 跳 转 到 第 7 行 
4 System.out.printlin(arr[i]); 

5 j++ 
6 无 条 件 跳 转 ， 跳 转 到 第 3 行 
7 其 他 代码 


在 这 中 ， 跳 转 只 会 往 后 面 跳 ， 而 for 会 往 前 面 跳 ， 第 6 行 就 是 无 条 件 
跳 转 指 令 ， 跳 转 到 了 前 面 的 第 3 行 。break/continue 语 句 也 都 会 转换 为 跳 
转 指 令 ， 具 体 殉 不 资 述 了 。 


154 小 于 


循环 的 语法 总 体 上 也 十 比较 位 单 的， 初学 者 需要 注意 的 是 for 的 执 
行 过 程 ， 以 及 break 和 continue 的 含义 。 虽 然 循 环 看 起 来 只 是 重复 执行 
一 些 类 似 的 操作 而 已 ,但 它 其 实 是 计算 机 程序 解决 问题 的 一 种 基本 思 
维 方式 ， 和 凭借 循环 (当然 还 有 别 的 ， 计 算 机 程序 可 以 发 挥 出 强大 的 
威力 ， 比 如 批量 转换 数据 、 碍 找 过 滤 数 据 、 统 计 汇总 等 。 


使 用 基本 数据 类 型 、 数 组 、 基 本 运算 ， 加 上 条 件 和 循环 ， 其 实 已 
经 可 以 写 很 多 程序 了 ， 但 这 样 写 出 来 的 程序 往往 难以 理解 ， 尤 其 是 程 
序 逻 辑 比 较 复 洒 的 时 候 。 


解决 复 洒 问题 的 基本 策略 是 分 而 治之 ， 将 复 灯 问题 分 解 为 耕 干 相 
对 简单 的 子 问题 ， 然 后 子 问 题 再 分 解 为 更 小 的 子 问题 .….. 程 序 由 数据 
和 指令 组 成 ， 大 程序 可 以 分 解 为 小 程序 ， 小 程序 接着 分 解 为 更 小 的 程 
序 ° 那 如 何 表 示 子 程序 ， 以 及 子 程序 之 间 如 何 协 调 呢 ?我 们 下 节 介 


1.6” 范 数 的 用 法 


如 果 需 要 经 党 做 某 一 种 操作 ， 则 类 似 的 代码 需要 重复 写 很 多 遍 。 
比如 在 一 个 数组 中 查找 某 个 数 ， 第 一 次 查找 一 个 数 ， 第 二 次 可 能 查找 
男 一 个 数 ， 每 查 一 个 数 ， 类 似 的 代码 都 需要 重 写 一 裔 ， 很 罗 唆 。 田 
外 ， 有 一 些 复 杂 的 操作 ， 可 能 分 为 很 多 个 步 又 ， 如 宁都 放 在 一 起 ， 则 
代码 难以 理解 和 维护 。 


计算 机 程序 使 用 函数 这 个 概念 来 解决 这 个 问题 ， 即 使 用 函数 来 减 
少 重 复 代码 和 分 解 复杂 操作 。 本 下 我 们 就 来 谈 谈 Java 中 的 函数 ， 包 丘 
函数 的 基本 概念 和 一 些 细节 ， 下 区 我 们 讨论 函数 的 基本 实现 原理 。 


1.6.1 基本 概念 


函数 这 个 概念 ， 我 们 学 数学 的 时 候 都 接触 过 ， 其 基本 格式 是 y=f 
(x) ， 表 示 的 是 x 到 y 的 对 应 关系 ， 给 定 输 入 x， 经 过 函数 变换 f， 输 出 
y。 程 序 中 的 函数 概念 与 其 类 似 ， 也 由 输入 、 操 作 和 输出 组 成 ,但 它 表 
示 的 是 一 段子 程序 ， 这 个 子 程序 有 一 个 名 字 ， 表 示 它 的 目的 (类比 
f) ， 有 和 零 个 或 多 个 参数 (类 比 x) ， 有 可 能 返回 一 个 结果 (类比 y) 。 
我 们 来 看 两 个 简单 的 例子 : 


public static int sum(int a, int b){ 
int sum = a + b; 
return sum; 
} 
public static void print3Lines(){ 
for(int i=0;i<3;i++){ 
System.out.println(); 


} 


第 一 个 函数 的 名 字 叫 做 sum， 它 的 目的 是 对 输入 的 两 个 数 求 和 ， 
有 两 个 输入 参数 ， 分 别 是 int 整 数 a 和 b， 它 的 操作 是 对 两 个 数 求 和 ， 求 
和 结果 放 在 变量 sum 中 (这 个 sum 和 函数 名 字 的 sum 没 有 任何 关系 ) ， 
然后 使 用 return 语 句 将 结果 返回 ， 最 开始 的 public static 是 函数 的 修饰 
符 ， 我 们 后 续 介 绍 。 


第 二 个 函数 的 名 字 叫 做 print3Lines， 它 的 目的 是 在 屏幕 上 输出 三 
个 空 行 ， 它 没有 输入 人 参数， 操作 是 使 用 一 个 循环 输出 三 个 空 行 ， 它 没 
有 返回 值 。 


以 上 代码 都 比较 简单 ， 主 要 是 演示 函数 的 基本 语法 结构 ， 即 : 


修饰 符 返回 值 类 型 ” 画 数 名 字 ( 参 数 类 型 参数 名 字 ，…) { 
操作 


return 返回 值 ; 


} 


函数 的 主要 组 成 部 分 有 以 下 几 种 。 
1) 函数 名 字 : 名 字 是 不 可 或 缺 的 ， 表 示 男 数 的 功能 


2) 参数 ， 参 数 有 0 个 到 多 个 ， 每 个 参数 由 参数 的 数据 类 型 和 参数 
名 字 组 成 。 


3) 操作 ， 画 数 的 具体 操作 代码 。 


4) 返回 值 : 函数 可 以 没有 返回 值 ， 如 果 没 有 返回 值 则 类 型 写成 
void， 如 果 有 则 在 函数 代码 中 必须 使 用 return 语 名 返回 一 个 值 ， 这 个 值 
的 类 型 需要 和 声明 的 返回 值 类 型 一 致 。 


5) 修饰 符 : Java 中 国 数 有 很 多 修饰 符 ， 分 别 表 示 不 同 的 目的 ， 本 
节 假 定 修饰 符 为 public static， 且 暂 不 讨论 这 些 些 修饰 符 的 目的 。 


以 上 就 是 定义 画 数 的 语法 。 定 义 画 数 就 是 定义 了 一 段 有 着 明确 功 
eh 但 定义 画 数 本 身 不 会 执行 任何 代码 ， 画 数 要 被 执行 ， 需 
做 诉 


Java 中 ， 任 何 函 数 都 需要 放 在 一 个 类 中 。 类 还 没有 介绍 ， 我 们 暂 
时 可 以 把 类 看 作 函 数 的 一 个 容 絮 ， 即 落 数 放 在 类 中 ， 类 中 包括 多 个 画 
数 ，Java 中 的 函数 一 般 叫 做 方法 ， 我 们 不 特别 区 分 函数 和 方法 ， 可 能 
会 交替 使 用 。 一 个 类 里 面 可 以 定义 多 个 函数 ， 类 里 面 可 以 定义 一 个 叫 
做 main 的 函数 ， 形 式 如 : 


public static void main(String[] args) { 


这 个 函数 有 特殊 的 信义， 表示 程 序 的 入 口 ，String[]args 表 示 从 控 
制 台 接收 到 的 参数 ， 我 们 暂时 可 以 忽略 它 。Java 中 运行 一 个 程序 的 时 
候 ， 需 要 指定 一 个 定义 了 main 函 数 的 类 ，Java 会 寻找 main 函 数 ， 并 从 
main 函 数 开 始 执行 。 


刚 开始 学 编程 的 人 可 能 会 误 以 为 程序 从 代码 的 第 一 行 开始 执行 
这 是 错误 的 ， 不 管 main 画 数 定义 在 哪里 ，Java 画 数 都 会 先 找到 它 ， 然 
后 从 它 的 第 一 行 开始 执行 


main 芳 数 中 除了 可 以 定义 变量 ,操作 数 据 ， 还 可 以 调用 其 他 画 
数 ， 如 下 所 示 : 


public static void main(String[] args) { 
int a = 2; 
int b = 3,; 
int sum = sum(a, b); 
System.out.println(sum); 
print3Lines(); 
System.out.println(sum(3,4)); 


调用 函数 需要 传递 参数 并 处 理 返 回 值 。main 函 数 首先 定义 了 两 个 
变量 a 和 b， 接 着 调用 了 函数 sum， 并 将 a 和 b 传 递 给 了 了 sum 函数 ， 然 后 将 
sum 的 结果 赋值 给 了 变量 sum。 


这 里 初学 者 需要 注意 的 是 ， 参 数 和 返回 值 的 名 字 是 没有 特别 含义 
的 。 调 用 者 main 中 的 参数 名 字 a 和 b， 和 函数 定义 sum 中 的 参数 名 字 a 和 
b 只 是 磁 巧 一 样 而 已 ， 它 们 完全 可 以 不 一 样 ， 而 且 名 字 之 间 没 有 关系 ， 
sum 函 数 中 不 能 使 用 main 函 数 中 的 名 字 ， 反 之 也 一 样 。 调 用 者 main 中 
的 sum 变 量 和 sum 函 数 中 的 Sum 变量 的 名 字 也 是 储 巧 一 样 而 已 ， 完 全 可 
a 。 另外， 变量 和 函数 可 以 取 一 样 的 名 字 ， 但 一 样 不 代表 有 特 
别 的 含义 。 


， 调 用 本 数 如 果 没有 参数 要 传递 ， 也 要 加 括号 ) ， 如 print3Lines 


传递 的 参数 不 一 定 是 个 变量 ， 可 以 是 常量 ， 也 可 以 是 某 个 运算 表 
达 式 ， 可 以 是 某 个 函数 的 返回 结果 。 比 如 : System.out.printtn (sum 


， ) ; ， 第 一 个 函数 调用 sum (3，4) ， 传 递 的 参数 是 常量 3 和 
4， 第 二 个 函数 调用 System.out.printin 传 递 的 参数 是 sum (3，4) 的 返 


关于 参数 传递 ， 简 单 总 结 一 下 ， 定 义 画 数 时 声明 参数 ， 实 际 上 就 
是 定义 变量 ， 只 是 这 些 变量 的 值 是 未 知 的 ， 调 用 画 数 时 传递 参数 ， 实 
际 上 就 是 给 画 数 中 的 变量 赋值 。 


i 
数 ， 比 如 : 


int a = 23; 
System.out.println(Integer.toBinarystring(a)); 


调用 Integer 类 中 的 toBinaryString 玉 数 ，toBinaryString 是 Integer 类 
中 修饰 符 为 public static 上 函数 ， 表 示 输 出 一 个 整数 的 二 进 制 表示 。 


对 于 需要 重复 执行 的 代码 ， 可 以 定义 函数 ， 然 后 在 需要 的 地 方 调 
用 ， 这 样 可 以 减少 重复 代码 。 对 于 复杂 的 操作 ， 可 以 将 操作 分 为 多 个 
函数 ， 会 使 得 代码 更 加 易 读 。 


我 们 知道 ， 程 序 执行 基本 上 只 有 顺序 执行 、 条 件 执行 和 循环 执 
行 ， 但 更 完整 的 措 述 应 该 包括 函数 的 调用 过 程 。 程 序 从 main 函 数 开 始 
执行 ， 碰 到 男 数 调 用 的 时 候 ， 会 跳 转 进 函数 内 部 ， 函 数 调 用 了 其 他 男 
数 ， 会 接着 进入 其 他 函数 ， 函 数 返回 后 会 继续 执行 调用 后 面 的 语句 ， 
返回 到 main 函 数 并 且 main 函 数 没有 要 执行 的 语句 后 程序 结束 。1.7 世 会 
更 深入 地 介绍 执行 过 程 细节 。 在 Java 中 ， 男 数 在 程序 代码 中 的 位 置 和 
实际 执行 的 顺序 是 没有 关系 的 。 


1.6.2 ”进一步 理解 函数 


函数 的 定义 和 基本 调用 应 该 是 比较 容易 理解 的 ， 但 有 很 多 细节 可 
能 令 初 学 者 困惑 ， 包 括 参数 传递 、 返 回 、 画 数 命名 、 调 用 过 程 等 ， 我 
们 逐个 介绍 。 


1. 参 数 传递 


有 两 类 特殊 类 型 的 参数 : 数组 和 可 变 长 度 的 参数 。 
(1) 数组 
数组 作为 参数 与 基本 类 型 是 不 一 样 的 ， 基 本 类 型 不 会 对 调用 者 中 


的 变量 造成 任何 影响 ， 但 数组 不 是 ， 在 函数 内 修改 数组 中 的 元 素 会 修 
改 调 用 者 中 的 数组 内 容 。 我 们 看 个 例子 : 


public static void reset(int[] arr){ 
for(int i=0;i<arr.length;i++){ 
arr[i] = 工 ; 
} 


} 
public static void main(String[] args) { 
int[] arr = {10,20,30,40}; 
reset(arr); 
for(int i=0;i<arr.length;i++){ 
System,.out,println(arr[I])， 
} 


在 reset 函 数 内 给 参数 数组 元 素 赋 值 ， 在 main 函 数 中 数组 arr 的 值 也 


这 个 其 实 也 容易 理解 ， 我 们 在 1.2 节 介绍 过 ， 一 个 数组 变量 有 两 块 
空间 ， 一 块 用 于 存储 数组 内 容 本 里， 男 一 块 用 于 存储 内 容 的 位 置 ， 给 
数组 变量 赋值 不 会 影响 原 有 的 数组 内 容 本 号 ， 而 只 会 让 数组 变量 指 同 
一 个 不 同 的 数组 内 容 空 间 。 


在 上 例 中 ， 函 数 参 数 中 的 数组 变量 arr 和 main 函 数 中 的 数组 变量 ar 
存储 的 都 是 相同 的 位 置 ， 而 数组 内 容 本 映 只 有 一 份 数据 ， 所 以 ,在 
reset 中 修改 数组 元 素 内 容 和 在 main 中 修改 是 完全 一 样 的 。 


(2) 可 变 长 度 的 参数 
前 面 介 绍 的 函数 ， 参 数 个 数 都 是 固定 的 ， 但 有 时 候 可 能 希望 参数 


个 数 不 是 固定 的 ， 比 如 求 者 干 个 数 的 最 大 值 ， 可 能 是 两 个 ， 也 可 能 是 
多 个 。Java 支 持 可 变 长 度 的 参数 ， 如 下 例 所 示 : 


public static int max(int min, int ... a)t{ 
int max = min; 
for(int i=0;i<a.length;i++){ 


if(max<a[i])t{ 
max = al[il]; 


return max; 


} 

public static void main(String[] args) { 
System.out.printljn(max(0)); 
System.out.println(max(0,2)); 
System.out.println(max(0,2,4)); 
System.out.println(max(0,2,4,5)); 


这 个 max 芳 数 毛 受 一 个 最 小 值 ， 以 及 可 变 长 度 的 铬 干 参数 ， 返 回 
其 中 的 最 大 值 。 可 变 长 度 参数 的 语法 是 在 数据 类 型 后 面 加 三 个 
所“.…”， 在 图 数 内 ， 可 变 长 度 参 数 可 以 看 作 是 数组 。 可 变 长 度 参数 少 
须 是 参数 列表 中 的 最 后 一 个 ， 一 个 函数 也 只 能 有 一 个 可 变 长 度 的 参 


数 


可 变 长 度 参 数 实际 上 会 转换 为 数组 参数 ， 也 就 是 说 ， 函 数 声 明 
max (int min，int...a) 实际 上 会 转换 为 max (int min，int[Ja) ， 在 
main 芳 数 调 用 max (0，2，4，5) 的 上 时候， 实际 上 会 转换 为 调用 max 

(0，new int[]{2，4，5}) ， 使 用 可 变 长 度 参数 主要 是 简化 了 代码 书 
与 o 


2. 理 解 返 回 


对 初学 者 ， 我 们 强调 下 return 的 含义 。 画 数 返 回 值 类 型 为 void 时 ， 
return 不 是 必需 的 ， 在 没有 return 的 情况 下 ， 会 执行 到 函数 结尾 自动 返 
回 。return 用 于 显 式 结束 函数 执行 ， 返 回调 用 方 。 


return 可 以 用 于 函数 内 的 任意 地 方 ， 可 以 在 函数 结尾 ， 也 可 以 在 中 
Se 可 以 在 for 循 环 内 ， 用 于 提前 结束 函数 执行 ， 返 
起 o 


函数 返回 值 类 型 为 void 也 可 以 使 用 return， 即 “return; ”， 不 用 带 
值 ， 售 义 是 返回 调用 方 ， 只 是 没有 返回 值 而 已 。 


函数 的 返回 值 最 多 只 能 有 一 个 ， 那 如 果实 际 情况 需要 多 个 返回 值 
呢 ? 比如 ， 计 算 一 个 整数 数组 中 的 最 大 的 前 三 个 数 ， 需 要 返回 三 个 结 
果 。 这 个 可 以 用 数组 作为 返回 值 ， 在 函数 内 创建 一 个 包含 三 个 元 素 的 
数组 ， 然 后 将 前 三 个 结果 赋 给 对 应 的 数组 元 聚 。 


如 果实 际 情况 需要 的 返回 值 古 一 种 复合 结 采 呢 ? 比 如 ， 查 找 一 个 
字符 数组 中 所 有 重复 出 现 的 字符 以 及 重复 出 现 的 次 数 。 这 个 可 以 用 对 
象 作 为 返回 值 ， 我 们 在 第 3 章 介绍 类 和 对 象 。 昌 然 返 回 值 最 多 只 能 有 一 
个 ， 但 其 实 一 个 也 够 了 。 


3. 重 复 的 命名 


每 个 画 数 都 有 一 个 名 字 ， 这 个 名 字 和 表示 这 个 函数 的 意义 ， 名 字 可 
案 是 肯定 的 ， 在 同一 个 类 里 ， 要 看 情 


同一 个 类 里 ， 画 数 可 以 重 名 ,但 古 参数 不 能 完全 一 样 ， 即 要 么 参 
数 个 数 不 同 ， 要 么 参数 个 数 相 同 但 至 少 有 一 个 参数 类 型 不 一 样 。 


同一 个 类 中 函数 名 相同 但 参数 不 同 的 现象 ， 一 般 称 为 钞 数 重 载 。 
为 什么 需要 函数 重 载 呢 ? 一 般 是 因为 男 数 想 表 达 的 意义 是 一 样 的 ， 但 
参数 个 数 或 类 型 不 一 样 。 比 如 ， 求 两 个 数 的 最 大 值 ， 在 Java 的 Math 库 
中 殊 定 义 了 4 个 画 数 ， 如 下 所 示 : 


public static double max(double a, double b) 
public static float max(float a, float b) 
public static int max(int a, int b) 

public static long max(long a, long b) 


4. 调 用 的 匹配 过 程 


在 之 前 介绍 函数 调用 的 时 候 ， 我 们 没有 竺 别 说 明 参 数 的 类 型 。 这 
里 说 明 一 下 ， 参 数 传 递 实际 上 是 给 参数 赋值 ， 调 用 者 传递 的 数据 需要 
与 函数 声明 的 参数 类 型 是 匹配 的 ， 但 不 要 求 完全 一 样 。 什 么 意思 呢 ? 
Java 编 译 器 会 目 动 进 行 类 型 转换 ， 并 寻找 最 匹配 的 函数 ， 比 如 : 


char a = 'a'; 
char b = 'b'; 
System.out.println(Math.max(a,b)); 


参数 是 字符 类 型 的 ， 但 Math 并 没有 定义 针对 字符 类 型 的 max 男 
数 ， 这 是 因为 char 其 实 是 一 个 整数 (我 们 在 2.4 节 会 说 明 ) ，Java 会 自 


动 将 char 转 换 为 int， 然 后 调用 Math.max (inta，intb) ， 屏 幕 会 输出 整 
数 结 果 98。 


如 果 Math 中 没有 定义 针对 int 类 型 的 max 函 数 呢 ? 调用 也 会 成 功 ， 
会 调用 long 类 型 的 max 函 数 。 如 果 1long 也 没有 呢 ? 会 调用 float 型 的 max 
函数 。 如 果 float 也 没有 ， 会 调用 double 型 的 。Java 编 译 俐 会 自动 寻找 最 
匹配 的 。 


在 只 有 一 个 函数 的 情况 下 ， 即 没有 重 载 ， 只 要 可 以 进行 类 型 轻 
束 会 调用 该 贸 数 ， 在 有 函数 重 载 的 情况 下 ， 会 调用 最 匹配 的 函 
数 。 


5. 记 归 团 数 


函数 大 部 分 情况 下 都 是 被 别 的 函数 调用 的 ， 但 其 实 函 数 也 可 以 调 
用 它 目 己 ， 调 用 目 己 的 函数 束 叫 递归 函数 。 为 什么 需要 目 己 调用 目 己 
呢 ? 我 们 来 看 一 个 例子 ， 求 一 个 数 的 阶乘 ， 数 学 中 一 个 数 n 的 阶乘 ， 表 
示 为 n! ， 它 的 值 定义 是 这 样 的 : 


0! =1 


n! = (n-1) ! xn 
0 的 阶乘 是 1，n 的 阶乘 的 值 是 n-1 的 阶乘 的 值 乘 以 n， 这 个 定义 是 一 


个 递归 的 定义 ， 为 求 n 的 值 ， 需 先 求 n-1 的 值 ， 直 到 0， 然 后 依次 往 回 
退 。 用 递归 表达 的 计算 用 递归 函数 容易 实现 ， 代 码 如 下 : 


public static long factorial(int n){ 
if(n==0){ 
return 1; 
}elsef{ 
return n*factorial(n-1); 
} 
} 


看 上 去 应 该 是 比较 容易 理解 的 ， 和 数学 定义 类 似 。 递 归 函 数 形式 
上 往往 比较 简单， 但 递归 其 实 古 有 开销 的 ， 而 且 使 用 不 当 ， 可 能 会 出 
现 意 外 的 结果 ， 比 如 说 这 个 调用 : 


System,.out,println(factorial(100000) ) 


系统 并 不 会 给 出 任何 结果 ， 而 会 抛 出 异常 。 有 寞 冲 我 们 在 第 6 章 介 
绍 ， 此 处 理解 为 系统 错误 就 可 以 了 。 异 常 类 型 为 
java.lang.StackOverflowError， 这 是 什么 意思 呢 ? 这 表示 栈 洲 出 错误 ， 
要 理解 这 个 错误 ， 我 们 需要 理解 男 数 调用 的 实现 原理 ， 我 们 1.7 节 介 


2 


那 递 归 不 可 行 的 情况 下 怎么 办 呢 ? 递归 函数 经 常 可 以 转换 为 非 递 
归 的 形式 ， 通 过 循环 实现 。 比 如 ， 求 阶乘 的 例子 ， 其 非 递 归 形 式 的 定 
义 古 : 


n! =1x2x3x...xn 


这 个 可 以 用 循环 来 实现 ， 代 码 如 下 : 


public static long factorial(int n){ 
long result = 1; 
for(int i=1; i<=n; i++){ 
result=result*i; 


return result; 


} 


1.6.3 小结 


函数 是 计算 机 程序 的 一 种 重要 结构 ， 通 过 函数 来 减少 重复 代码 、 
分 解 复杂 操作 是 计算 机 程序 的 一 种 重要 思维 方式 。 本 市 我 们 介绍 了 函 
A 以 及 关于 参数 传递 、 返 回 值 、 重 载 、 递 归 方 面 的 一 些 
细节 。 


在 Java 中 ， 函 数 还 有 大 量 的 修饰 从 ， 如 public 、private 、static 、 
final、synchronized、abstract 等 ， 本 贡 假 定 钞 数 的 修饰 特 都 是 public 
static， 在 后 续 章 节 中 ， 我 们 再 介绍 这 些 修饰 从 。 函 数 中 还 可 以 声明 异 
常 ， 我 们 也 到 第 6 革 再 介绍 。 


1.7_” 数 调用 的 基本 诛 理 


在 介绍 递归 函数 鸭 时 候 ， 我 们 看 到 了 一 个 系统 钳 误 : 
java.lang.StackOverflowError， 理 解 这 个 错误 ， 需 要 理解 函数 调用 的 实 
现 机 制 。 下 面 ， 我 们 移 来 了 解 一 个 重要 的 概念 : 栈 ， 然 后 再 通过 一 些 
例子 来 仔细 分 析 函 数 调用 的 过 程 。 


1.7.1 栈 的 概念 


我 们 之 前 谈 过 程序 执行 的 基本 原理 : CPU 有 一 个 指令 指示 器 ， 指 
癌 下 一 条 要 执行 的 指令 ， 要 么 顺序 执行 ， 要 么 进行 跳 转 (条 件 跳 转 或 
无 条 件 跳 转 ) 。 


基本 上 ， 这 依然 是 成 立 的 ， 程 序 从 main 函 数 开始 顺序 执行 ， 函 数 
调用 可 以 看 作 一 个 无 条 件 跳 转 ， 跳 转 到 对 应 函数 的 指令 处 开始 执行 ， 
页 到 retum 语 句 或 者 函数 结尾 的 时 候 ， 再 执行 一 次 无 条 件 跳 转 ， 跳 转 回 
调用 方 ， 执 行 调 用 函数 后 的 下 一 条 指令 。 


但 这 里 面 有 几 个 问题 。 
1) 参数 如 何 传递 ? 
2) 函数 如 何 知 道 返回 到 什么 地 方 ? 在 if/else、for 中 ， 跳 转 的 地 址 


都 是 确定 的 ， 但 函数 目 己 并 不 知道 会 被 谁 调用 ， 而 且 可 能 会 被 很 多 地 
方 调用 ， 它 并 不 能 提前 知道 执行 结束 后 返回 哪里 。 


3) 函数 结果 如 何 传 给 调用 方 ? 


解决 思路 是 使 用 内 存 来 存放 这 些 数 据 ， 芳 数 调用 方 和 函数 目 己 下 
如 何 存放 和 使 用 这 些 数据 达成 一 个 一 致 的 协议 或 约定 。 这 个 约定 在 各 
种 计算 机 系统 中 都 是 类 似 的 ， 存 放 这 些 数据 的 内 存 有 一 个 相同 的 名 
字 省 机 
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栈 是 一 块 内 存 ， 但 它 的 使 用 有 特别 的 约定 ， 一 般 是 先进 后 出 ， 类 
似 于 一 个 桶 ， 往 栈 里 放 数 据 称 为 入 栈 ， 最 下 面 的 称 为 栈 原 ， 最 上 面 的 
称 为 栈 顶 ， 从 栈 顶 拿 出 数据 通常 称 为 出 栈 。 栈 一 般 是 从 高 位 地 址 向 低 


展 ， 换 句 话 说， 栈 底 的 内 存 地址 是 最 高 的 ， 栈 项 的 是 最 低 


计算 机 系统 主要 使 用 栈 来 存放 函数 调用 过 程 中 需要 的 数据 ， 包 括 
参数 、 返 回 地 址 ， 以 及 函数 内 定义 的 局 部 变量 。 计 算 机 系统 就 如 何在 
栈 中 存放 这 些 数据 ， 调 用 着 和 画 数 如 何 协 作 做 了 约定 。 返 回 值 不 太一 
样 ， 它 可 能 放 在 栈 中 ， 但 它 使 用 的 栈 和 局 部 变量 不 完全 一 样 ， 
统 使 用 CPU 内 的 一 个 存储 融 存 储 返 回 值 ， 我 们 可 以 商 单 认为 存在 一 
私 站 的 巡回 仁 丰 全 器 < mein 攻 数 的 相关 数据 放 在 本 的 最 下 则 “得 调用 
一 次 函数 ， 痢 会 将 相关 函 数 的 数据 入 栈 ， 调 用 结束 会 出 栈 。 


1.7.2 ”函数 执行 的 基本 原理 


以 上 描述 可 能 有 点 抽象 ， 我 们 通过 一 个 例子 来 具体 说 明 函 数 执行 
的 过 程 ， 看 个 商 单 例 子 : 


public class Sum { 


工 

2 

3 public static int sum(int a, int b) { 

4 int c = b; 

5 return c; 

6 } 

7 

public static void main(String[] args) { 
in 2); 


d = Sum.sum(1, 
10 System.out.println(d); 


‘Om 


这 是 一 个 人 简单 的 例子 ，main 玉 数 调用 了 sum 碎 数 ， 计 算 1 和 2 的 和 ， 
然后 输出 计算 结果 ， 从 概念 上 ， 这 是 容易 理解 的 ， 让 我 们 从 栈 的 角度 
来 讨论 下 。 

“， 当 程序 在 main 函 数 调用 Sum.sum 之 前 ， 栈 的 情况 大 概 如 图 1-1 所 
示 。 

栈 中 主要 存放 了 两 个 变量 args 和 d。 在 程序 执行 到 Sum.sum 的 函数 

内 部 ， 准 备 返 回 之 前 ， 即 第 5 行 ， 栈 的 情况 大 概 如 图 1-2 所 示 。 


我 们 解释 下 ， 在 main 函 数 调用 Sum.sum 时 ， 首 先 将 参数 1 和 2 入 栈 ， 
然后 将 返回 地 址 (也 就 是 调用 函数 结束 后 要 执行 的 指令 地 址 ) 入 栈 ， 


接着 跳 转 到 sum 函 数 ， 在 sum 函 数 内 部 ， 和 需要 为 局 部 变量 c 分 配 一 个 空 
间 ， 而 参数 变量 a 和 b 则 直接 对 应 于 入 栈 的 数据 1 和 2， 在 返回 之 前 ， 返 
回 值 保 存 到 了 专门 的 返回 值 存储 万 中 。 


在 调用 returm 后 ， 程 序 会 跳 转 到 栈 中 保存 的 返回 地 址 ， 即 main 的 下 
一 条 指令 地 址 ， 而 sum 画 数 相 关 的 数据 会 出 栈 ， 从 而 又 变 回 图 1-1 的 样 
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图 1-1 调用 Sum.sum 之 前 的 栈 示 意图 


main 


人 
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main 下 一 条 指令 地 址 
EE 


图 1-2” 在 Sum.sum 内 部 ， 准 备 返 回 之 前 的 栈 示意 图 


main 的 下 一 条 指令 生根 据 函 数 返 回 值 给 变量 q 赋 值 ， 返 回 值 从 专门 
的 返回 值 存 储 侨 中 获得 。 


main 


男 数 执行 国 基 公 原理 ， 疝 香 末 说 陨 是 这 任 "但 有 一 些 需要 介绍 的 
局 5 我 们 讨论 一 下 


我 们 在 1.1 节 的 时 候 说 过 ， 定 义 一 个 变量 束 会 分 配 一 块 内 存 ， 但 我 
ee 具体 分 配 在 哪里 ， 什 么 时 候 释 放 
子 ° 


从 以 上 关于 栈 的 手 述 我 们 可 以 看 出 ， 画 数 中 的 参数 和 函数 内 定义 
的 变量 ， 部 分 配 在 栈 中 ， 这 些 变量 只 有 在 画 数 被 调用 的 时 候 才 分 配 ， 
而 且 在 调用 结束 后 号 馈 释 放 了 。 但 这 个 说 法 主要 针对 基本 数据 类 型 ， 
接 下 来 我 们 介绍 数组 和 对 象 。 


1.7.3 ”数组 和 对 象 的 内 存 分 配 


对 于 数组 和 对 象 类 型 ， 我 们 介绍 过 ， 它 们 都 有 两 块 内 存 ， 一 块 存 

放 实 际 的 内 容 ， 一 块 存放 实际 内 容 的 地 址 ， 实 际 的 内 容 空间 一 般 不 是 

分 配 在 栈 上 的 ， 而 是 分 配 在 堆 (也 是 内 存 的 一 部 分 ， 后 续 章 节 会 进 一 
步 介 绍 ) 中 ， 但 存放 地 址 的 空间 是 分 配 在 栈 上 的 。 我 们 来 看 个 例子 : 


public class ArrayMax { 
public static int max(int min, int[] arr) { 
int max = min， 
for(int a : arr){ 
if(a>max){ 
max = a; 


return max; 


} 
public static void ee args) { 
int[] arr = new int[]{2,3,4}; 

int ret = max(0, arr); 
System.out.printin(ret); 
} 
} 


这 个 程序 也 很 简单 ，main 函 数 新 建 了 一 个 数组 ， 然 后 调用 函数 max 
计算 0 和 数组 中 元 素 的 最 大 值 ， 在 程序 执行 到 max 函 数 的 return 语 句 之 前 
的 时 候 ， 内 存 中 栈 和 堆 的 情况 如 图 1-3 所 示 。 


0x7FFC Ox1000(arr) 


返回 值 存储 器 
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堆 


图 1-3 ”参数 有 数组 的 内 存 栈 和 堆 示 意图 


对 于 数组 arr， 在 栈 中 存放 的 是 实际 内 容 的 地 址 0x1000， 存 放 地 址 
的 栈 空间 会 随 着 入 栈 分 配 ， 出 栈 释 放 ， 但 存放 实际 内 容 的 堆 空间 不 受 


影响 。 


但 说 堆 空间 完全 不 受 影响 是 不 正确 的 ， 在 这 个 例子 中 ， 当 main 芳 


数 执行 结束 ， 栈 空间 没有 变量 指向 它 的 时 候 ，Java 系 统 会 自动 进行 垃圾 


回收 ， 从 而 释放 这 块 空间 。 


1.7.4 递归 调用 的 原理 


我 们 再 通过 栈 的 角度 来 理解 一 下 


public static int factorial(int n){ 
if(n==0){ 
return 1; 
}elsef 
return n*factorial(n-1); 
} 


} 

public static void main(String[] args) { 
int ret = factorial(4); 
System.out.printin(ret); 

: 


累 归 函数 的 调用 过 程 ， 代 码 如 


在 factorial 第 一 次 被 调用 的 时 候 ， 
1) ， 即 4*factorial (3) 之 前 的 时 候 ， 


n 是 4， 在 执行 到 n*factorial (n- 
栈 的 情况 大 概 如 图 1-4 所 示 。 


注意 ， 返 回 值 存储 器 是 没有 值 的 ， 在 调用 factorial (3) 后 ， 栈 的 情 
况 如 图 1-5 所 示 。 


栈 的 深度 增加 了 ， 返 回 值 存储 需 依 然 为 空 ， 就 这 样 ， 每 递归 调用 
一 次 ， 栈 的 深度 就 增加 一 层 ， 每 次 调用 都 会 分 配对 应 的 参数 和 局 部 变 
a 会 保存 调用 的 返回 地 址 ， 在 调用 到 n 等 于 0 的 时 候 ， 栈 的 情况 
I 鬼 1-6 所 不 。 


这 个 时 候 ， 终 于 有 返回 值 了 ， 我 们 将 factorial 简 写 为 f。f (0) 的 返 
回 值 为 1; f (0) 返回 到 f (1) ，f (1) 执行 1 (0) ， 结 果 也 是 1; 然 
后 返回 到 f (2) ，f (2) 执行 2*f (1) ， 结 果 是 2;， 接 着 返回 到 f (3) ， 
， (3) 执行 3*f (2) ， 结 果 是 6; 然后 返 回 到 f (4) ， 执 行 4*f (3) ， 结 

是 24。 
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图 1-4 递归 调用 栈 示 意图 ，n 为 4 
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图 1-5 ”递归 调用 栈 示意 图 ，n 为 3 
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factorial(0) “返回 值 存 储 器 
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图 1-6 ”递归 调用 栈 示意 图 ，n 为 0 
以 上 就 是 递归 函数 的 执行 过 程 ， 函 数 代 码 虽 然 只 有 一 份 ， 但 在 执 


行 的 过 程 中 ， 每 调用 一 次 ， 束 会 有 一 次 入 栈 生成 一 份 不 同 的 参数 、 
局 部 变量 和 返回 地 址 。 


factorial(4) 


main 


1.7.5， 四 征 


本 节 介 绍 函 数 调 用 的 基本 原理 ， 函 数 调用 主要 是 通过 栈 来 存储 
相关 的 数据 ， 系 统 束 函 数 调用 者 和 函数 如 何 使 用 栈 做 了 约定 ， 返 回 值 
可 以 简单 认为 是 通过 一 个 专门 的 返回 值 存储 豆 存 储 的 。 


从 函数 调用 的 过 程 可 以 看 出 ， 调用 征 有 成 本 的 ， 一 次 调用 都 需 
要 分 配额 外 的 栈 空 间 用 于 存储 参数 、 局 部 变 需要 进 
行 额 外 的 入 栈 和 出 栈 操作 。 在 递归 调用 的 情况 下 ， 如 果 递 归 的 次 数 比 
较 多 ， 这 个 成 本 是 比较 可 观 的 ， 所 以 ， 如 采 程 序 可 以 比较 容易 地 改 为 
其 他 方式 ， 应 该 考虑 其 他 方式 。 另 外 ， 栈 的 空间 不 是 无 限 的 ， 一 般 正 
常 调用 都 是 没有 问题 的 ， 但 如 有 果 栈 空间 过 深 ， 系 统 就 会 抛 出 错误 
java.lang.StackOverflowError， 即 栈 洲 出 。 


至 此 ， 关 于 编程 的 基础 知识 ， 包 括 数据 类 型 和 变量 、 周 值 、 基 本 
运 茎 、 流 程控 制 中 生 条 件 执行 和 循环 ， 以 及 函数 的 概念 和 基本 原理 ， 
束 介 绍 完 了 。 我 们 谈 到 ， 在 Java 中 ， 函 数 必须 放 在 类 中 ， 目 前 我 们 简单 
认为 类 只 是 画 数 的 容 句 ， 但 类 在 Java 中 远 不 止 有 这 个 功能 ， 它 还 承载 了 


很 多 概念 和 思维 方式 ， 在 探讨 类 的 概念 之 前 ， 在 下 一 章 ， 我 们 先 来 进 
一 步 理解 下 各 种 基本 数据 类 型 和 文本 青 后 的 二 进 制 表示 。 


第 2 草 ”理解 数据 至 后 的 二 进 制 
在 第 1 章 ， 我 们 遗留 了 几 个 问题 。 
正 整数 相 乘 的 结果 居然 出 现 了 负数 。 
非常 基本 的 小 数 运算 结果 居然 不 精确 。 


人 


字符 类 型 也 可 以 进行 算术 运算 和 比较 。 


要 理解 这 些 行为 ， 我 们 需要 理解 数值 和 文本 字符 在 计算 机 内 部 的 
二 进 制 表示 ， 本 章 束 来 介绍 各 种 数据 痛 后 的 二 进 制 ， 具 体 分 为 4: 

2.1 节 介绍 整数 ，2.2 节 介绍 小 数 ，2.3 节 介绍 与 语言 元 关 的 字符 和 文本 
的 编码 以 及 乱码 ;2.4 节 介绍 Java 中 表示 字符 的 基本 类 型 char。 


2.1 整数 的 二 进 制 表示 与 位 运算 


要 理解 整数 的 二 进 制 ， 我 们 先 来 看 下 熟悉 的 十 进 制 。 我 们 对 十 进 
制 钙 如 此 熟悉 ， 可 能 已 忽略 了 它 的 舍 义 。 比 如 123， 不 假 思索 我 们 束 知 
道 它 的 值 是 多 少 。 


但 其 实 123 表 示 1x (10^2) +2x (10A1) +3x (10^0) (10^2 表 示 10 
的 二 次 方 ) ， 它 表示 的 是 各 个 位 置 数字 含义 之 和 ， 每 个 位 置 的 数字 含 
义 与 位 置 有 关 ， 从 右 向 左 ， 第 一 位 乘 以 10 的 0 次 方 ， 即 1， 第 二 位 乘 以 
10 的 1 次 方 ， 即 10， 第 三 位 乘 以 10 的 2 次 方 ， 即 100， 以 此 类 推 。 


换 名 话说， 每 个 位 置 都 有 一 个 位 权 ， 从 右 到 左 ， 第 一 位 为 1， 然 后 
依次 乘 以 10， 即 第 二 位 为 10， 第 三 位 为 100， 以 此 类 推 。 


2.1.1 正 整数 的 二 进 制 表示 


正 整 数 的 二 进 制 表示 与 此 类 似 ， 只 是 在 十 进 制 中 ， 每 个 位 置 可 以 
有 10 个 数字 ， 为 0~9， 但 在 二 进 制 中 ， 每 个 位 置 只 能 是 0 或 1。 位 权 的 
概念 是 类 似 的 ， 从 右 到 左 ， 第 一 位 为 1， 然 后 依次 乘 以 2， 即 第 二 位 为 
0 以 此 类 推 。 表 2-1 列 出 了 一 些 数 字 的 二 进 制 与 对 应 的 十 
进 制 。 


表 2-1 二 进 制 与 对 应 的 十 进 制 


2.1.2 ”人 负 整 数 的 二 进 制 表 示 


十 进 制 的 负数 表示 束 古 在 前 面 加 一 个 负数 符号 -， 例 如 -123。 但 二 
进 制 如 何 表示 负数 呢 ? 其 实 概念 是 类 似 的 ， 二 进 制 使 用 最 高 位 表示 符 
号 位 ， 用 1 表示 负数 ， 用 0 表示 正 数 。 但 哪个 是 最 高 位 呢 ? 整数 有 4 种 类 
型 byte、short、int、long， 分 别 占 1、2、4、8 个 字 节 ， 即 分 别 占 8、 


16、32、64 位 ， 每 种 类 型 的 符号 位 都 是 其 最 左边 的 一 位 。 为 方便 举 
例 ， 下 面 假定 类 型 是 byte， 即 从 右 到 左 的 第 8 位 表示 符号 位 。 


但 负数 表示 不 是 简单 地 将 最 高 位 变 为 1， 比 如 : 


1) byte a=-1， 如 果 只 是 将 最 高 位 变 为 1， 二 进 制 应 该 是 10000001， 
但 实际 上 ， 它 应 该 是 11111111 。 


2) byte a=-127， 如 果 只 是 将 最 高 位 变 为 1， 二 进 制 应 该 是 
11111111， 但 实际 上 ， 它 却 应 该 是 10000001。 


和 我 们 的 直觉 正好 相反 ， 这 是 什么 表示 法 ? 这 种 表示 法 称 为 补 码 
表示 法 ， 而 符合 我 们 直觉 的 表示 称 为 原 码 表示 法 ， 补 码 表 示 束 旦 在 原 
码 表示 的 基础 上 取 反 然后 加 1。 取 友 束 是 将 0 变 为 1，1 变 为 0° 负数 的 二 
进 制 表 示 束 古 对 应 的 正 数 的 补 码 表 示 ， 比 如 : 


1) -1: 1 的 原 码 表示 是 00000001， 取 反 是 11111110， 然 后 再 加 1 
就 是 11111111 。 


2) -2: 2 的 原 码 表示 是 00000010， 取 反 是 11111101， 然 后 再 加 1 
就 是 11111110 。 


3) -127: 127 的 原 码 表示 是 01111111， 取 反 是 10000000， 然 后 再 加 
1， 就 是 10000001。 


给 定 一 个 负数 的 二 进 制 表示 ， 要 想 知 道 它 的 十 进 制 值 ， 可 以 采用 
相同 的 补 码 运算 。 比 如 : 10010010， 首 先 取 反 ， 变 为 01101101， 然 后 
加 1， 结 果 为 01101110， 它 的 十 进 制 值 为 110， 所 以 原 值 就 是 -110。 直 和 觉 
上 ， 应 该 是 先 减 1， 然 后 再 取 反 ， 但 计算 机 只 能 做 加 法 ， 而 补 码 的 一 个 
民 好 特性 就 是 ， 对 负数 的 补 码 表示 做 补 码 运 算 就 可 以 得 到 其 对 应 正 数 
的 原 码 ， 正 如 十 进 制 运算 中 负 负 得 正 一 样 。 


对 于 byte 类 型 ， 正 数 最 大 表示 是 01111111， 即 127， 负 数 最 小 表示 
(绝对 值 最 大 ) 是 10000000， 即 -128， 表 示范 围 就 是 -128~127。 其 他 
类 型 的 整数 也 类 似 ， 负 数 能 多 表示 一 个 数 。 


负 整 数 为 什么 要 采用 这 种 奇怪 的 表示 形式 呢 ? 原因 是 ， 只 有 这 种 
形式 ， 计 算 机 才能 实现 正确 的 加 减法 。 


计算 机 其 实 只 能 做 加 法 ，1-1 其 实 是 1+ (-1) 。 如 果 用 原 码 表示 ， 
计算 结果 是 不 对 的 ， 比 如 : 


1 -> 00000001 
-1 -> 10000001 


用 符合 直觉 的 原 码 表示 ，1-1 的 结果 是 -2， 如 果 是 促 码 表示 : 


1 -> 00000001 
-1 -> 11111111 


© -> 00000000 


结果 是 正确 的 。 表 如 ，5-3: 


5 -> 00000101 
-3 -> 11111101 


2 -> 00000010 


结 采 也 是 正确 的 。 束 是 这 样 ， 看 上 去 可 能 比较 奇怪 和 难以 理解 ， 
但 这 种 表示 其 实 是 非常 严 谍 和 正确 的 ， 是 不 是 很 奇妙 ? 


理解 了 二 进 制 加 减法 ， 我 们 就 能 理解 为 什么 正 数 的 运算 结 采 可 能 
出 现 负 数 了 。 当 计算 结 末 超 出 表示 范围 的 时 候 ， 最 蜗 位 往往 是 1， 然 后 
束 会 被 看 作 人 有 负数。 比如，127+1: 


127 -> ©1111111 
1 -> 00000001 


-128 -> 10000069 
计算 结果 超出 了 byte 的 表示 范围 ， 会 被 看 作 -128。 


2.1.3 十 六 进 制 


二 进 制 写 起 来 太 长 ， 为 了 简化 写法 ， 可 以 将 4 个 二 进 制 位 简化 为 一 
个 0~15 的 数 ，10~15 用 字符 A~F 表 示 ， 这 种 表示 方法 称 为 十 六 进 制 ， 
如 表 2-2 所 示 。 


表 2-2 十 六 进 制 


二 进 制 
1010 
1111 


1100 


可 以 用 十 六 进 制 直接 写 常量 数字 ， 在 数字 前 面 加 0x 即 可 。 比 如 十 
进 制 的 123， 用 十 六 进 制 表示 是 0x7B， 即 123=7x16+11。 给 整数 赋值 或 
者 进行 运算 的 时 候 ， 都 可 以 直接 使 用 十 六 进 制 ， 比 如 : 


int a = QOx7B; 


Java 7 之 前 不 支持 直接 写 二 进 制 常量 。 比 如 ， 想 写 二 进 制 形式 的 
11001，Java 7 之 前 不 能 直接 写 ， 可 以 在 前 面 补 0， 补 足 8 位 ， 为 
00011001， 然 后 用 十 六 进 制 表示 ， 即 0x19。Java 7 开始 支持 二 进 制 常 
量 ， 在 前 面 加 0b 或 0B 即 可 ， 比 如 : 


int a = 0b11001， 


在 Java 中 ， 可 以 方便 地 使 用 Integer 和 Long 的 方法 查看 整数 的 二 进 制 
和 十 六 进 制 表示 ， 例 如 ; 


System.out.println(Integer.toBinaryString(a) )， // 二 进 肯 
System.out.println(Integer.toHexString(a) )， // 十 六 进 人 
System.out.println(Long.toBinaryString(a)); // 二 进 制 
System.out.println(Long.toHexString(a)); // 十 六 进出 


Pc 


1 位 运 生 


理解 了 二 进 制 表示 ， 我 们 来 看 二 进 制 级 别 的 操作 : 位 运算 。Java 7 
之 前 不 能 单独 表示 一 个 位 ， 但 可 以 用 byte 表 示 8 位 ， 用 十 六 进 制 写 一 进 


制 常 量 。 比 如 ，0010 表 示 成 十 六 进 制 是 0x2，110110 表 示 成 十 六 进 制 是 
0x36 。 

位 运算 有 移 位 运算 和 逻辑 运算 。 移 位 有 以 下 几 种 。 

1) 左 移 : 操作 符 为 <<， 疝 左 移动 ， 右 边 的 低位 补 0， 高 位 的 就 舍 
弃 近 了 ， 将 二进制 看 作 整 数 ， 左 移 1 位 就 相当 于 乘 以 2。 
2) 无 符号 右 移 :操作 符 为 >>>， 辣 右 移动 ， 右 边 的 舍弃 掉 ， 左 边 
fFMO° 

3) 有 符号 右 移 :操作 符 为 >>， 向 右 移动 ， 右 边 的 舍弃 掉 ， 左 边 补 
什么 取决 于 原来 最 高 位 是 什么 ， 原 来 是 1 就 补 1， 原 来 是 0 就 补 0， 将 二 
进 制 看 作 整 数 ， 右 移 1 位 相当 于 除 以 2。 


例如 : 


int a = 4; //100 
a = a >> 2; //001， 等 于 1 
a = a << 3 //1000， 变 为 8 


逻辑 运算 有 以 下 几 种 。 

- 按 位 与 & 两 位 都 为 1 才 为 1。 

- 按 位 或 | 只 要 有 一 位 为 1， 就 为 1 。 

. 按 位 取 反 ~: 1 变 为 0，0 变 为 1 。 

- 按 位 异 或 ^， 相 异 为 真 ， 相 同 为 假 。 

大 部 分 都 比较 简单 ， 如 下 所 示 ， 具 体 就 不 袭 述 了 。 


nt 


a = 
a & 0x1 // 返 回 0 或 1， 就 是 a 最 右边 一 位 的 f 
二 Q 


i 
a 且 
a | 0x1 // 不 管 a 原 来 最 右边 一 位 是 什么 ， 都 将 设 为 1 


2.2 “小数 的 二 进 制 表示 


计算 机 之 所 以 叫 “ 计 算 ” 机 ， 束 是 因为 发 明 它 主 要 是 用 来 计算 
的 ,“ 计 算 ” 当 然 是 它 的 特长 ， 在 大 家 的 印象 中 ， 计 算 一 定 古 非常 准确 
的 。 但 实际 上 ， 有 即使 在 一 些 非常 基本 的 小 数 运算 中 ， 计 算 的 结果 也 是 
不 精确 的 ， 比 如 : 


float f = 0.1f*0.1f; 
System.out.println(f); 


这 个 结果 看 上 去 ， 应 该 是 0.01， 但 实际 上 ， 屏 幕 输出 却 是 
0.010000001， 后 面 多 了 个 1。 看 上 去 这 么 简单 的 运算 ， 计 算 机 怎么 会 
出 错 了 呢 ? 


2.2.1 小 数 计算 为 什么 会 出 销 


实际 上 ， 不 是 运算 本 映 会 出 错 ， 而 是 计算 机 根本 束 不 能 精确 地 表 
示 很 多 数 ， 比 如 0.1 这 个 数 。 计 算 机 是 用 一 种 二 进 制 格式 存储 小 数 的 ， 
这 个 二 进 制 格式 不 能 精确 表示 0.1， 它 只 能 表示 一 个 非常 接近 0.1 但 又 不 
等 于 0.1 的 一 个 数 。 数 字 都 不 能 精确 表示 ， 在 不 精确 数字 上 的 运算 结果 
不 精确 也 就 不 足 为 奇 了 。 


0.1 怎 么 整 不 能 精确 表示 呢 ? 在 十 进 制 的 世界 里 是 可 以 的 ， 但 在 二 
进 制 的 世界 里 不 行 。 在 说 二 进 制 之 前 ， 我 们 先 来 看 下 熟悉 的 十 进 制 。 


实际 上 ， 十 进 制 也 只 能 表示 那些 可 以 表述 为 10 的 多 少 次 方 和 的 
数 ， 比 如 12.345， 实 际 上 表示 的 是 1x10+2x1+3x0.1+4x0.01+5x0.001， 
与 整数 的 表示 类 似 ， 小 数 点 后 面 的 每 个 位 置 也 都 有 一 个 位 权 ， 从 左 到 
右 ， 依 次 为 0.1，0.01，0.001... 即 10A (-1) ，10^ (-2) ，10A (-3) 


和 。 
于 


很 多 数 十 进 制 也 是 不 能 精确 表示 的 ， 比 如 1/3， 保 留 三 位 小 数 的 
话 ， 十 进 制 表 示 是 0.333， 但 无 论 后 面 保 留 多 少 位 小 数 ， 都 古 不 精确 


的 ， 用 0.333 进 行 运 算 ， 比 如 乘 以 3， 期 望 结果 是 1， 但 实际 上 却 是 
0.999 。 


二 进 制 是 类 似 的 ， 但 二 进 制 只 能 表示 那些 可 以 表述 为 2 的 多 少 次 方 
和 的 数 。 来 看 下 2 的 次 方 的 一 些 例子 ， 如 表 2-3 所 示 。 


表 2-3 ”2 的 次 方 


一 3 机 十 进 制 
2^(-1) 0.5 
2^(-2) 0.25 
2^(-3) 0.125 
2^(-4) 0.0625 


可 以 精确 表示 为 2 的 某 次 方 之 和 的 数 可 以 精确 表示 ， 其 他 数 则 不 能 
精确 表示 。 


为 什么 计算 机 中 不 能 用 我 们 熟悉 的 十 进 制 呢 ? 在 最 底层 ， 计 算 机 
使 用 的 电子 元 磊 件 只 能 表示 两 个 状态 ， 通 常 是 低压 和 高 讨 ， 对 应 0 和 
1， 使 用 二 进 制 容易 基于 这 些 电 子 元 大 件 构建 硬件 设备 和 进行 运算 。 如 
果 非 要 使 用 十 进 制 ， 则 这 些 硬 件 就 会 复杂 很 多 ， 并 且 效 率 低下 。 


如 果 编 写 程序 进行 试验 ， 会 发 现 有 的 计算 结果 是 准确 的 。 比 如 ， 
用 Java 写 


System,.out,println(0.1f+0.1f)， 
System,.out,println(0.1f*0.1f)， 


第 一 行 输出 0.2， 第 二 行 输出 0.010000001。 按 照 上 面 的 说 法 ， 第 一 
行 的 结果 应 该 也 不 对 。 其 实 ， 这 只 是 Java 语 言 给 我 们 造成 的 假象 ， 计 
算 结 果 其 实 也 是 不 精确 的 ， 但 是 由 于 结果 和 0.2 足 够 接近 ， 在 输出 的 时 


候 ，Java 选 择 了 输出 0.2 这 个 看 上 去 非常 精简 的 数字 ， 而 不 是 一 个 中 间 
有 很 多 0 的 小 数 。 在 误差 足够 小 的 时 候 ， 结 采 看 上 去 是 精确 的 ， 但 不 精 
确 其 实 才 是 种 仿 。 


计算 不 精确 ， 怎 么 办 呢 ? 大 部 分 情况 下 ， 我 们 不 需要 那么 高 的 精 
度 ， 可 以 四 售 五 入 ， 或 者 在 输出 的 时 候 只 保留 固定 个 数 的 小 数位 。 如 
果真 的 需要 比较 高 的 精度 ， 一 种 方法 是 将 小 数 转 化 为 整数 进行 运算 ， 
运算 结束 后 再 转化 为 小 数 ， 男 一 种 方法 是 使 用 十 进 制 的 数据 类 型 ， 这 
个 并 没有 统一 的 规范 。 在 Java 中 是 BigDecimal， 运 算 更 准确 ， 但 效率 
比较 低 ， 本 市 就 不 介绍 了 。 


2.2.2” 二进制 表示 


我 们 之 前 一 直 存 用“ 小数 * 这 个 词 表示 float 和 double 类 型 ， 其 实 ， 这 
是 不 严谨 的 ，“ 小 数 ”是 在 数学 中 用 的 词 ， 在 计算 机 中 ， 我 们 一 般 说 的 
是 “ 浮 点 数 ”。float 和 double 被 称 为 浮 点 数据 类 型 ， 小 数 运算 被 称 为 浮 点 
算 。 


为 什么 要 叫 序 点数 呢 ? 这 是 由 于 小 数 的 二 进 制 表示 中 ， 表 示 那 个 
小 数 点 的 时 候 ， 点 不 是 固定 的 ， 而 是 浮动 的 。 


我 们 还 是 用 十 进 制 类 比 ， 十 进 制 有 科学 记 数 法 ， 比 如 123.45 这 个 
数 ， 直 接 这 么 写 ， 就 是 固定 表示 法 ， 如 果 用 科学 记 数 法 ， 在 小 数 点 前 
只 保留 一 位 数字 ， 可 以 写 为 1.2345E2 即 1.2345x (10^2) ， 即 在 科学 记 
数 法 中 ， 小 数 点 向 左 浮动 了 两 位 。 


二 进 制 中 为 表示 小 数 ， 也 采用 类 似 的 科学 表示 法 ， 形 如 mx 
(2^e) 。m 称 为 尾数 ，e 称 为 指数 。 指 数 可 以 为 正 ， 也 可 以 为 负 ， 负 
的 指数 表示 那些 接近 0 的 比较 小 的 数 。 在 二 进 制 中 ， 单 独 表示 尾数 部 分 
和 指数 部 分 ， 另 外 还 有 一 个 符号 位 表示 正 负 。 


几乎 所 有 的 硬件 和 编程 语言 表示 小 数 的 二 进 制 格式 都 是 一 样 的 。 
这 种 格式 是 一 个 标准 ， 叫 做 IEEE 754 标 准 ， 它 定义 了 两 种 格式 : 一 种 
是 32 位 的 ， 对 应 于 Java 的 float; 另 一 种 是 64 位 的 ， 对 应 于 Java 的 
double 。 


Y 


| 


虹 


32 位 格式 中 ，1 位 表示 符号 ，23 位 表示 尾数 ，8 位 表示 指数 。64 位 
格式 中 ，1 位 表示 符号 ，52 位 表示 尾数 ，11 位 表示 指数 。 在 两 种 格式 
中 ， 除 了 表示 正常 的 数 ， 标 准 还 规定 了 一 些 特殊 的 二 进 制 形 式 表 示 一 
些 特殊 的 值 ， 比 如 负 无 穷 、 正 无 穷 、0、NaN (〈 非 数值 ， 比 如 0 乘 以 无 
穷 大 ) 。IEEE 754 标 准 有 一 些 复杂 的 细节 ， 初 次 看 上 去 难以 理解 ， 对 
于 日 常 应 用 也 不 常用 ， 本 书 就 不 介绍 了 。 


人 


Integer.toBinaryString(Float.floatToIntBits(value)) 
Long.toBinaryString(Double.doubleToLongBits(value)); 


2.3 字符 的 编码 与 乱码 


本 下 讨论 与 语言 无 天 的 字符 和 文本 的 编码 以 及 乱码 。 我们 在 处 理 
文件 、 浏 览 网 页 、 编 写 程序 时 ， 时 不 时 会 碰 到 乱码 的 情况 。 乱 码 几乎 
总 是 令 人 心烦 ， 让 人 困惑 ， 通 过 阅读 本 三， 相信 你 束 可 以 目 信 从 容 地 
面 对 乱 码 ， 进 而 恢复 乱码 了 。 


编码 和 乱码 听 起 来 比较 复杂 ， 但 其 实 并 不 复杂 ， 请 附 心 阅读 ， 证 
我 们 逐步 来 探讨 。 我 们 先 介 绍 各 种 编码 ， 然 后 介绍 编码 转换 ， 分 析 乱 
码 出 现 的 原因 ， 最 后 介绍 如 何 从 乱码 中 恢复 。 编 码 有 两 大 类 : 一 类 是 
非 Unicode 编 码 ; 另 一 类 是 Unicode 编 码 。 我 们 先 介 绍 非 Unicode 编 码 。 


2.3.1 ”和 常见 非 Unicode 编 码 


下 面 我 们 看 一 些 主 要 的 非 Unicode 编 码 ， 包 括 ASCII、ISO 8859-1、 
Windows-1252、GB2312、GBK、GB18030 和 了 Big5。 


1.ASCII 


世界 上 虽然 有 各 种 各 样 的 字符 ， 但 计算 机 发 明之 初 没 有 考虑 那么 
多 ， 基 本 上 只 考虑 了 美国 的 需求 。 美 国 大 概 只 需要 128 个 字符 ， 所 以 就 
规定 了 128 个 字符 的 二 进 制 表示 方法 。 这 个 方法 是 一 个 标准 ， 称 为 
ASCII 编 码 ， 全 称 是 American Standard Code for Information 
Interchange， 即 美国 信息 互 换 标准 代码 。 


128 个 字符 用 7 位 刚好 可 以 表示 ， 计 算 机 存储 的 最 小 单位 是 byte， 即 
8 位 ，ASCII 码 中 最 高 位 设置 为 0， 用 剩 下 的 7 位 表示 字符 。 这 7 位 可 以 看 
作 数 字 0~-127，ASCII 码 规定 了 从 0~127 的 每 个 数字 代表 什么 含义 。 


我 们 先 来 看 数字 32 一 126 的 含义 ， 如 图 2-1 所 示 ， 除 了 中 文 之 外 ,我 
们 平常 用 的 字符 基本 都 涵盖 了 ， 键 盘 上 的 字符 大 部 分 也 都 涵盖 了 。 


[a 
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空格 
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—A 中 -QCAFTOADP、 菇 
Yeo3o0—~CZFMIIuI1w 
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图 2-1 ASCII 编 码 : 可 打印 字符 
数字 32 人 126 表 示 的 字符 都 是 可 打印 字符 ，0~31 和 127 表 示 一 些 不 
可 以 打印 的 字符 ， 这 些 字符 一 般 用 于 控制 目的 ， 这 些 字 符 中 大 部 分 都 
是 不 常用 的 ， 表 2-4 列 出 了 其 中 相对 常用 的 字符 。 
表 2-4 ASCII 编 码 : 常用 不 可 打印 字符 


0 NUL (null) Pl 
) 
ed 


‘0 


8 BS (backspace) 退 格 \b 


( 
i TY 


ASCII 码 对 美国 是 够 用 了 ， 但 对 其 他 国家 而 言 却 是 不 够 的 ， 于 是 ， 
各 个 国家 的 各 种 计算 机 厂商 就 发 明了 各 种 各 种 的 编码 方式 以 表示 目 己 
国家 的 字符 ， 为 了 保持 与 ASCII 码 的 兼容 性 ， 一 般 都 是 将 最 高 位 设置 为 
1° 也 就 是 说 ， 当 最 高 位 为 0 时 ， 表 示 ASCII 码 ， 当 为 1 时 就 是 各 个 国家 
目 己 的 字符 。 在 这 些 扩展 的 编码 中 ， 在 西欧 国家 中 流行 的 是 ISO 8859-1 
和 Windows-1252， 在 中 国 是 GB2312、GBK、GB18030 和 Big5， 我 们 逐 
个 介绍 这 些 编码 。 


9 HT (horizontal tab 水 平 制 表 符 \t 


2.1ISO 8859-1 


ISO 8859-1 叉 称 Latin-1， 它 也 是 使 用 一 个 字 节 表示 一 个 字符 ， 其 中 
0~127 与 ASCII 一 样 ，128~255 规 定 了 不 同 的 含义 。 在 128~255 中 ， 
128 一 159 表 示 一 些 控制 字符 ， 这 些 字符 也 不 遂 用， 就 不 介绍 了 。160 一 
255 表 示 一 些 西 欧 字 符 ， 如 图 2-2 所 示 。 


NBSP 1 名 £ u 至 | S © a « 盖 SHY ® 
00a0 00R1 O00a2 00A3 00a4 00a5 00a6 00A7 00A8 00A9 00RR 00RB 00ac 00aD. OO0AE OO0AF 
160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 
全 2 3 rv 可 ， 1 Q » 鼻 EE 2 
00B0 00B1 00B2 00B3 00B4 00B5 00B6 00B7 00B8 00B9 00BA 00BB 00BC 00BD 00BE O00BF 
176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 
A A A A A A 下 SG 兰 EE E E 于 工 人 工 
00c0 00c1 00c2 00c3 00c4 00c5 00C6 00c7 00c8 00c9 00cR 00CcB oocc 00cD 00CE 00CF 
192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 
D N oO 0 0 6 x [a UV d 0 U 4 Bb B 
oop0 00D1 00D2 00D3 00D4 00D5 00D6 00D7 00p8 00p9 00DA 00DB oopc 00DD 00DE 00pF 
208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 
a & a a EI 有 3 所 所 e [= 5 到 主 半 
oog0 00E1 00E2 00E3 00E4 00E5 00E6 00E7 00E8 00E9 00EA 00EB 00EC 00ED 00EE 00EF 
224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 
名 五 6 6 6 6 = o du 豆 a i 8 b y 
00F0 00P1 00F2 00F3 00P4 00P5 00F6 00F7 00F8 00F9 00FA 00FB 00FC 00FD 00FE 00PP 
240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 


图 2-2 ISO 8859-1 
3.Windows-1252 


ISO 8859-1 虽 然 号 称 是 标准 ， 用 于 西欧 国家 ， 但 它 连 欧元 (€) 这 
个 符号 都 没有 ， 因 为 欧元 比较 晚 ， 而 标准 比较 早 。 实 际 中 使 用 更 为 广 
泛 的 是 windows-1252 编码 ， 这 个 编码 与 ISO 8859-1 基 本 是 一 样 的 ， 区 
别 只 在 于 数字 128~159。Windows-1252 使 用 其 中 的 一 些 数字 表示 可 打 
印字 符 ， 这 些 数字 表示 的 含义 如 图 2-3 所 示 。 


图 2-3 ”Windows-1252 编 码 : 区 别 于 ISO8859-1 的 部 分 
这 个 编码 中 加 入 了 欧元 符号 以 及 一 些 其 他 常用 的 字符 。 基 本 上 可 


以 认为 ，ISO 8859-1 已 被 Windows-1252 取 代 ， 在 很 多 应 用 程序 中 ， 即 使 
采用 的 是 ISO 8859-1 编 码 ， 解 析 的 时 候 依 然 被 当 作 Windows- 
1252 编 码 。 


HTML5 甚 至 明确 规定 ， 如 果 文 件 声 明 的 是 ISO 8859-1 编 码 ， 它 应 
该 被 看 作 Win-dows-1252 编 码 。 为 什么 要 这 样 呢 ? 因为 大 部 分 人 搞 不 清 
楚 ISO 8859-1 和 Windows-1252 的 区 别 ， 当 他 说 ISO 8859-1 的 时 候 ， 其 实 
他 指 的 是 Windows-1252， 所 以 标准 干脆 束 这 么 强制 规定 了 。 


4.GB2312 

类 国 和 西欧 字符 用 一 个 字 节 了 束 够 了 ， 但 中 文 显然 是 不 够 的 。 中 文 
第 一 个 标准 是 GB2312。GB2312 标 准 主 要 针对 的 是 简体 中 文 常见 字符 ， 
包括 约 7000 个 汉字 和 一 些 罕 用 词 和 繁体 字 。 

GB2312 固 定 使 用 两 个 字 节 表示 汉字 ， 在 这 两 个 字 节 中 ， 最 高 位 都 
是 1， 如 果 是 0， 就 认为 是 ASCII 字 符 。 在 这 两 个 字 节 中 ， 其 中 高 位 字 节 
范围 是 0xA1~-0xF7， 低 位 字 节 范围 是 0xA1~-0xFE 。 

比如 , “ 老 马 ”的 GB2312 编 码 〈 十 六 进 制 表示 ) 如 表 2-5 所 示 。 


表 2-5 ”GB2312 编 码 示 例 


5.GBK 


GBK 建 立 在 GB2312 的 基础 上 ， 同 下 兼容 GB2312， 也 就 是 说 ， 
GB2312 编 码 的 字 从 和 二 进 制 表示 ， 在 GBK 编 码 里 是 完全 一 样 的 。GBK 
增加 了 14000 多 个 汉字 ， 共 计 约 21000 个 汉字 ， 其 中 包括 繁体 字 。 


GBK 同 样 使 用 固定 的 两 个 字 节 表示 ， 其 中 高 位 字 节 范围 是 0x81 一 


0xFE， 低 位 字 节 范围 是 0x40~0x7E 和 0x80~-0OxFE 。 


需要 注意 的 是 ， 低 位 字 节 是 从 0x40 (也 就 是 64) 开始 的 ， 也 就 是 
说 ， 低 位 字 节 的 最 高 位 可 能 为 0。 那 怎么 知道 它 是 汉字 的 一 部 分 ， 还 是 
一 个 ASCII 字 符 呢 ? 其 实 很 简单 ， 因 为 汉字 是 用 固定 两 个 字 蔬 表示 的 ， 
在 解析 二 进 制 流 的 时 候 ， 如 果 第 一 个 字 世 的 最 高 位 为 1， 那 么 束 将 下 一 


个 字 世 读 进 来 一 起 解析 为 一 个 汉字 ， 而 不 用 考虑 它 的 最 高 位 ， 解 析 完 
后 ， 跳 到 第 三 个 字 市 继续 解析 。 


6.GB18030 


a 


GB18030 向 下 兼容 GBK， 增 加 了 55000 多 个 字符 ， 共 76000 多 个 字 
符 ， 包 括 了 很 多 少数 民族 字符 ， 以 及 中 日 韩 统一 字符 。 


用 两 个 字 节 已 经 表示 不 了 GB18030 中 的 所 有 字符 ，GB18030 使 用 变 
长 编码 ， 有 的 字符 是 两 个 字 节 ， 有 的 是 四 个 字 节 。 在 两 字 节 编码 中 ， 
字 节 表示 苑 围 与 GBK 一 样 。 在 四 字 节 编码 中 ， 第 一 个 字 万 的 值 为 0x81 
~-0xFE， 第 二 个 字 节 的 值 为 0x30~-0x39， 第 三 个 字 节 的 值 为 0x81~- 
0xFE， 第 四 个 字 节 的 值 为 0x30~0x39。 


解析 二 进 制 时 ， 如 何 知 道 是 两 个 字 世 还 是 4 个 字 世 表示 一 个 字符 
呢 ? 看 第 二 个 字 节 的 范围 ， 如 果 是 0x30~0x39 就 是 4 个 字 节 表示 ， 因 为 
两 个 字 节 编码 中 第 二 个 字 节 都 比 这 个 大 。 


7.Big5 


Big5 是 针对 繁体 中 文 的 ， 广 泛 用 于 我 国 台 湾 地 区 和 我 国 香 港 特 别 
行政 区 等 地 。Big5 包 括 13000 多 个 繁体 字 ， 和 GB2312 类 似 ， 一 个 字符 同 
样 固 定 使 用 两 个 字 节 表示 。 在 这 两 个 字 节 中 ， 高 位 字 节 范围 是 0x81 一 
0xFE， 低 位 字 节 范围 是 0x40~-0x7E 和 0xA1~-OxFE 。 


8. 编 码 汇总 
我 们 简单 汇总 一 下 前 面 的 内 容 。 


ASCII 码 是 基础 ， 使 用 一 个 字 节 表示 ， 最 高 位 设 为 0， 其 他 7 位 表示 
128 个 字符 。 其 他 编码 都 是 兼容 ASCII 的 ， 最 高 位 使 用 1 来 进行 区 分 。 


西欧 主要 使 用 Windows-1252， 使 用 一 个 字 世 ， 增 加 了 额外 128 个 字 
符 。 


我 国内 地 的 三 个 主要 编码 GB2312、GBK、GB18030 有 时 间 先 后 关 
系 ， 表 示 的 字符 数 越 来 越 多 ， 且 后 面 的 兼容 前 面 的 ，GB2312 和 GBK 都 
是 用 两 个 字 节 表示 ， 而 GB18030 则 使 用 两 个 或 四 个 字 节 表示 。 


我 国 香港 特别 行政 区 和 我 国 台湾 地 区 的 主要 编码 是 Big5 。 


如 条 文本 里 的 字符 都 征 ASCII 码 字符 ， 那 么 采用 以 上 所 说 的 任 一 编 
码 方式 都 是 一 样 的 。 


但 如 果 有 高 位 为 1 的 字符 ， 除 了 GB2312、GBK、GB18030 外 ， 其 
他 编码 都 是 不 兼容 的 。 比 如 ，Windows-1252 和 中 文 的 各 种 编码 是 不 兼 
容 的 ， 即 使 Big5 和 GB18030 都 能 表示 繁体 字 ， 其 表示 方式 也 是 不 一 样 
的 ， 而 这 就 会 出 现 所 谓 的 乱码 ， 具 体 我 们 稍 后 介绍 。 


2.3.2 Unicode 编码 


以 上 我 们 介绍 了 中 文 和 西欧 的 字符 与 编码 ， 但 世界 上 还 有 很 多 其 
他 国家 的 字符 ， 每 个 国家 的 各 种 计算 机 三 商都 对 目 己 利用 的 字符 进行 
编码 ， 在 编码 的 时 候 基 本 忽略 了 其 他 国家 的 字符 和 编码 ， 甚 至 忽略 了 
同一 国家 的 其 他 计算 机 厂商 ， 这 样 造成 的 结 采 束 是 ， 出 现 了 太 多 的 编 
码 ， 且 互相 不 兼容 。 


世界 上 所 有 的 字符 能 不 能 统一 编码 呢 ? 可 以 ， 这 束 是 Unicode 。 


Unicode 做 了 一 件 事 ， 就 是 给 世界 上 所 有 字符 都 分 配 了 一 个 唯一 的 
数字 编号 ， 这 个 编号 范围 从 0x000000~-0x10FFFF， 包 括 110 多 万 。 但 大 
部 分 常用 字符 都 在 0x0000~-0xFFFF 之 间 ， 即 65536 个 数字 之 内 。 每 个 字 
符 都 有 一 个 Unicode 编 号 ， 这 个 编号 一 般 写 成 十 六 进 制 ， 在 前 面 加 U+。 
大 部 分 中 文 的 编号 范围 为 U+4E00~U+9FFFE， 例 如 ,“ 马 ”的 Unicode 是 
U+9A6C 。 


简单 理解 ，Unicode 主 要 做 了 这 么 一 件 事 ， 融 是 给 所 有 字符 分 配 了 
唯一 数字 编号 。 它 并 没有 规定 这 个 编号 怎么 对 应 到 二 进 制 表示 ， 这 有 是 
与 上 面 介 绍 的 其 他 编码 不 同 的 ， 其 他 编码 都 既 规 定 了 能 表示 哪些 字 
符 ， 又 规定 了 每 个 字符 对 应 的 二 进 制 是 什么 ， 而 Unicode 本 喘 只 规定 了 
每 个 字符 的 数字 编号 是 多 少 。 


那 编 号 怎么 对 应 到 二 进 制 表 示 呢 ?有 多 种 方案 ， 主 要 有 UTF-32、 
UTF-16 和 UTF-8。 


1.UTF-32 


这 个 最 简单 ， 束 是 字符 编号 的 整数 二 进 制 形 式 ，4 个 字 节 。 

但 有 个 细 世 ， 残 是 字 世 的 排列 顺序 ， 如 采 第 一 个 字 下 是 整数 二 进 
制 中 的 最 高 位 ， 最 后 一 个 字 节 是 整数 二 进 制 中 的 最 低位 ， 那 这 种 字 市 
序 就 叫 “ 大 端 ”(Big Endian，BE) ， 否 则 ， 就 叫 “ 小 端 ” (Little Endian， 
LE) 。 对 应 的 编码 方式 分 别 是 UTF-32BE 和 UTF-32LE 。 


可 以 看 出 ， 每 个 字符 都 用 4 个 字 节 表示 ， 非 常 浪费 空间 ， 实 际 采 用 
的 也 比较 少 。 


2.UTF-16 


UTF-16 使 用 变 长 子 市 表示 : 


1) 对 于 编号 在 U+0000~~U+FFFF 的 字符 (常用 字符 集 ) ， 直 接 用 
两 个 字 节 表示 。 需 要 说 明 的 是 ，U+D800~U+DBFF 的 编号 其 实 是 没有 
定义 的 。 


2) 字符 值 在 U+10000~U+10FFFF 的 字符 〈 也 叫做 增补 字符 集 ) ， 
需要 用 4 个 字 节 表示 。 前 两 个 字 节 叫 高 代理 项 ， 范 围 是 U+D800~ 
U+DBFF; 后 两 个 字 世 叫 低 代理 项 ， 范 围 是 U+DC00~U+DFFF。 数 字 
编号 和 这 个 二 进 制 表示 之 间 有 一 个 转换 算法 ， 本 书 就 不 介绍 了 。 


区 分 是 两 个 字 世 还 是 4 个 字 节 表示 一 个 字符 就 看 前 两 个 字 世 的 编号 
范围 ， 如 果 是 U+D800~U+DBFF， 就 是 4 个 字 节 ， 否 则 就 是 两 个 字 世 。 


UTF-16 也 有 和 UTF-32 一 样 的 字 节 序 问 题 ， 如 果 高 位 存放 在 前 面 就 
叫 大 端 (BE) ， 编 码 就 叫 UTF-16BE， 否 则 就 叫 小 端 ， 编 码 就 叫 UTE- 
16LE。 


UTF-16 常 用 于 系统 内 部 编码 ，UTF-16 比 UTF-32 节 省 了 很 多 空间 ， 
但 是 任 但 一 个 字符 都 至 少 需要 两 个 字 节 表示 ， 对 于 美国 和 西欧 国家 而 
言 ， 还 是 很 浪费 的 。 


3.UTF-8 


UTF-8 使 用 变 长 字 世 表示 ， 每 个 字符 使 用 的 字 下 个 数 与 其 Unicode 
编号 的 大 小 有 关 ， 编 号 小 的 使 用 的 字 市 束 少 ， 编 号 大 的 使 用 的 子 市 整 
多 ， 使 用 的 字 节 个 数 为 1~4 不 等 。 


具体 来 说 ， 各 个 Unicode 编 号 范围 对 应 的 二 进 制 格式 如 表 2-6 所 示 。 
表 2-6 UTF-8 编 码 的 编号 范围 与 对 应 的 二 进 制 格式 


编号 范围 二 进 制 格 式 
Ox00~~0x7E (0==127.) OXXXXXXX 
0x80 一 0x7FF ( 128 一 2047 ) llOxxxxx 10XXXXXX 
Ox800~0xFFFF (2048~65 535 ) lllOxxxx 10XXXXXX 1]10XXXXXX 


0x10000 一 0x10FFFF (65 536 以 上 ) 


表 2-6 中 的 x 表 示 可 以 用 的 二 进 制 位 ， 而 每 个 字 节 开头 的 1 或 0 是 固定 

小 于 128 的 ， 编 码 与 ASCII 码 一 样 ， 最 高 位 为 0。 其 他 编号 的 第 一 个 
字 节 有 特殊 含义 ， 最 高 位 有 几 个 连续 的 1 就 表示 用 几 个 字 节 表示 ， 而 其 
他 字 节 都 以 10 开 头 。 

对 于 一 个 Unicode 编 号 ， 具 体 怎 么 编码 呢 ? 首先 将 其 看 作 整 数 ， 转 
化 为 二 进 制 形 式 〈 去 掉 高 位 的 0) ， 然 后 将 二 进 制 位 从 右 回 左 依次 填 入 
We 填 完 后 ， 如 果 对 应 的 二 进 制 格式 还 有 没 填 的 
X， 则 设 为 0。 


我 们 来 看 个 例子 ,，“ 马 ”的 Unicode 编 号 是 0x9A6C， 整 数 编号 是 
39532， 其 对 应 的 UTF-8 二 进 制 格 式 是 : 


1110xxxx 10XXXXXX 10xxxxxx 


整数 编号 39532 的 二 进 制 格式 是 : 


1001 101001 101100 


将 这 个 二 进 制 位 从 右 到 左 依 次 填 入 二 进 制 格式 中 ， 结 果 束 是 其 
UTF-8 编 码 : 


11101001 10101001 10101100 


FF 六 进 制 表示 为 0xE9A9AC 。 


和 UTF-32/UTF-16 不 同 ，UTF-8 是 兼容 ASCI 的 ， 对 大 部 分 中 文 而 
= 


4.Unicode 编 码 小 结 


Unicode 给 世界 上 所 有 字符 都 规定 了 一 个 统一 的 编号 ， 编号 范围 达 
到 110 多 万 ， 但 大 部 分 字符 都 在 65536 以 内 。Unicode 本 身 没 有 规定 怎么 
把 这 个 编号 对 应 到 二 进 制 形 式 。 


UTF-32/UTF-16/UTF-8 都 在 做 一 件 事 ， 就 是 把 Unicode 编 号 对 应 到 
二 进 制 形式 ， 其 对 应 方法 不 同 而 已 。UTF-32 使 用 4 个 字 节 ，UTF-16 大 
部 分 是 两 个 字 节 ， 少 部 分 是 4 个 字 节 ， 它 们 都 不 兼容 ASCII 编 码 ， 都 有 
字 节 顺序 的 问题 。UTF-8 使 用 1~-4 个 字 节 表示 ， 兼 容 ASCII 编 码 ， 英 文 
字符 使 用 1 个 字 季 ， 中 文字 符 大 多 用 3 个 字 节 。 


2.3.3 ”编码 转换 


有 了 Unicode 之 后 ， 每 一 个 字符 融 有 了 多 种 不 兼容 的 编码 方式 ， 比 
如 说“ 马 ? 这 个 字符 ， 它 的 各 种 编码 方式 对 应 的 十 六 进 制 如 表 2-7 所 示 。 


表 2-7 字符 “ 马 ” 多 种 编码 方式 


Unicode 编号 9A 6C UTF-16LE 6C 9A 


这 几 种 格式 之 间 可 以 借助 Unicode 编 号 进行 编码 转换 。 可 以 认为 : 
每 种 编码 都 有 一 个 映 冉 表 ， 和 存储 其 特有 的 子 符 编码 和 Unicode 编 号 之 间 
的 对 应 关系 ， 这 个 映射 表 是 一 个 商 化 的 说 法 ， 实 际 上 可 能 是 一 个 映射 
或 转换 方法 。 

编码 转换 的 具体 过 程 可 以 是 : 一 个 字符 从 A 编码 园 到 B 编 码 ， 先 找 


到 字符 的 A 编码 格式 ， 通 过 A 的 映射 表 找 到 其 Unicode 编 号 ， 然 后 通过 
Unicode 编 号 再 查 B 的 映射 表 ， 找 到 字符 的 B 编 码 格式 。 


举例 来 说 ,，“ 马 ”从 GB18030 转 到 UTF-8， 先 查 GB18030->Unicode 编 
号 表 ， 得 到 其 编号 是 9A 6C， 然 后 查 Uncode 编 号 ->UTF-8 表 ， 得 到 其 
UTF-8 编 码 : E9A9AC 。 


人 二 进 制 内 容 ， 但 并 没有 改变 字符 看 上 去 的 


2.3.4 乱码 的 原因 


理解 了 编码 ， 我 们 来 看 乱码 。 乱 码 有 两 种 常见 原因 : 一 种 比较 简 
单 ， 束 古人 简单 的 解析 错误 ;为 外 一 种 比较 复 哥 ， 在 错误 解析 的 基础 上 
进行 了 编码 转换 。 我 们 分 别 介绍 。 


1. 解 析 错 误 


看 个 简单 的 例子 。 一 个 法 国人 采用 Windows-1252 编 码 写 了 个 文 
件 ， 发 送 给 了 一 个 中 国人 ， 中 国人 使 用 GB18030 来 解析 这 个 字符 ， 看 
到 的 可 能 就 是 乱码 。 比 如 ， 法 国人 发 送 的 是 Pékin，Windows-1252 的 二 
进 制 (采用 十 六 进 制 ) 是 50E96B 696E， 第 二 个 字 节 E9 对 应 6， 其 他 都 
是 ASCII 码 ， 中 国人 收 到 的 也 是 这 个 二 进 制 ， 但 是 他 把 它 看 成 了 
GB18030 编 码 ，GB18030 中 E96B 对 应 的 是 字符 “ 闭 ”"， 于 是 他 看 到 的 就 
是 “P 闭 in”， 这 看 来 就 是 一 个 乱码 。 


反之 也 是 一 样 的 ， 一 个 GB18030 编 码 的 文件 如 果 被 看 作 Windows- 
1252 也 是 乱码 。 


这 种 情况 下 ， 之 所 以 看 起 来 是 乱码 ， 是 因为 看 待 或 者 说 解析 数据 
的 方式 错 了 。 只 要 使 用 正确 的 编码 方式 进行 解读 就 可 以 纠正 了 。 很 多 
文件 编辑 器 ， 如 EditPlus、NotePad++、UltraEdit 都 有 切换 查看 编码 方式 
的 功能 ， 浏 览 器 也 都 有 切换 查看 编码 方式 的 功能 ， 如 Fire-fox， 在 菜 
单 “ 查 看 ”- “文字 编码 ”中 即 可 找到 该 功能 。 


切换 碍 看 编码 的 方式 并 没有 改变 数据 的 二 进 制 本 号 ， 而 只 是 改变 
了 解析 数据 的 方式 ， 从 而 改变 了 数据 看 起 来 的 样子 ， 这 与 前 面 所 到 的 
编码 转换 正好 相反 。 很 多 时 候 ， 做 这 样 一 个 编码 查看 方式 的 切换 束 可 
以 解决 乱码 的 问题 ， 但 有 的 时 候 这 样 是 不 够 的 。 


2. 错 误 的 解析 和 编码 转换 


如 有 条 怎 么 改变 得 看 方式 都 不 对 ， 那 很 有 可 能 束 不 仅仅 是 解析 二 进 
制 的 方式 不 对 ， 而 古文 本 在 错误 解析 的 基础 上 还 进行 了 编码 转换 。 我 
们 举 个 例子 来 说 明 : 


1) 两 个 字 “ 老 马 ”， 本 来 的 编码 格式 是 GB18030， 编 码 (十 六 进 
制 ) 是 COCF C2ED 。 


2) 这 个 二 进 制 形式 被 错误 当成 了 Windows-1252 编 码 ， 解 读 成 了 字 
符 <AIAP 。 


3) 随后 这 个 字符 进行 了 编码 转换 ， 转 换 成 了 UTF-8 编 码 ， 形 式 还 
“AiAfP>， 但 二 进 制 变 成 了 C380C38F C382C3AD， 每 个 字符 两 个 字 


4) 这 个 时 候 再 按照 GB18030 解 析 ， 了 字符 整 变 成 了 乱码 形式 “ 胜 肥 胸 
饰 ”"， 而 且 这 时 无 论 怎么 切换 查看 编码 的 方式 ， 这 个 二 进 制 看 起 来 都 古 


这 种 情况 是 乱码 产生 的 主要 原因 。 


这 种 情况 其 实 很 常见 ， 计 算 机 程序 为 了 便于 统一 处 理 ， 经 常会 将 
所 有 编码 转换 为 一 种 方式 ， 比 如 UTF-8， 在 转换 的 时 候 ， 需 要 知道 原来 
的 编码 是 什么 ， 但 可 能 会 搞 错 ， 而 一 旦 搞 错 并 进行 了 转换 ， 就 会 出 现 
0 。 这 种 情况 下 ， 无 论坛 么 切换 查看 编码 方式 都 是 不 行 的 ， 如 
2-8 呆 不。 


表 2-8 用 不 同 编码 方式 查看 错误 转换 后 的 二 进 制 


上 六 进 制 C3 80 C3 8F C3 82 C3 AD 用 腔 胸 锦 
Windows-1252 | 


虽然 有 这 么 多 形式 ， 但 我 们 看 到 的 乱码 形式 很 可 能 是 “ATAf”， 
为 在 例子 中 UTF-8 是 编码 转换 的 目标 编码 格式 ， 既 然 较 换 为 了 UTF-8， 
一 般 也 是 要 按 UTF-8 查 看 。 


那 有 没有 办 法 恢复 呢 ? 如 果 有 ， 怎 么 恢复 呢 ? 


2.3.5 “从 乱码 中 恢复 


“下 ”主要 是 因为 发 生 了 一 次 错误 的 编码 转换 ， 所 谓 恢 复 ， 是 指 要 
恢复 两 个 关键 信息 : 一 个 是 原来 的 二 进 制 编码 方式 A; 另 一 个 是 错误 解 
读 的 编码 方式 B。 


恢复 的 基本 思路 是 答 试 进行 逆 回 操作 ， 假 定 按 一 种 编码 转换 方式 B 
获取 乱码 的 二 进 制 格 式 ， 然 后 再 假定 一 种 编码 解读 方式 A 解读 这 个 二 进 
制 ， 查 看 其 看 上 去 的 形式 ， 这 要 尝试 多 种 编码 ， 如 果 能 找到 看 着 正常 
的 字符 形式 ， 应 该 就 可 以 恢复 。 

这 听 上 去 可 能 比较 抽象 ， 我 们 举 个 例子 来 说 明 ， 假 定 乱码 形式 
是 “ATAf”， 尝 试 多 种 B 和 A 来 看 字符 形式 。 我 们 先 使 用 编辑 器 ， 以 
UltraEdit 为 例 ， 然 后 使 用 Java 编 程 来 看 。 

1. 使 用 UltraEdit 


UltraEdit 文 持 编 码 较 换 和 切换 查看 编码 方式 ， 也 文 持 文件 的 二 进 制 
显示 和 编辑 ， 所 以 我 们 以 UltraEdit 为 例 ， 其 他 一 些 编辑 器 可 能 也 有 类 似 


新 建 一 个 UTF-8 编 码 的 文件 ， 复 制 “AiIAfP 到 文件 中 。 使 用 编码 转 
换 ， 转 换 到 Win-dows-1252 编 码 ， 执 行 “ 文 件 ” “转换 到 ”-“ 西 
欧 ””~ WIN-1252 命 令 。 


”转换 完 后 ， 打 开 十 六 进 制 编 狂 ， 查 看 其 二 进 制 形式 ， 如 图 2-4 所 
不 ° 


项 征 人 b” 


总 四 49 = > 昌 
由 加山 名 车 上 
自动 换行 ” 列 模式 十 六 进 制 编辑 亮 


设置 字体 


查找 文本 查找 上 一 个 查找 下 一 个 ”替换 高 


图 2-4 使 用 UltraEdit 查 看 二 进 制 


可 以 看 出 ， 其 形式 还 是 “AIAfP 但 二 进 制 格式 变 成 了 COCEF C2ED 。 
这 个 过 程 相当 于 假设 B 是 Windows-1252。 这 个 时 候 ， 再 按照 多 种 编码 格 
式 查 看 这 个 二 进 制 ， 在 UltraEdit 中 ， 关 闭 十 六 进 制 编辑 ， 切 换 查 看 编码 
方式 为 GB18030， 执 行 “ 视 图 ” “查看 方式 (文件 编码 ) ”- “东亚 语 
言 ">GB18030 命 令 ， 切 换 完 后 ， 同 样 的 二 进 制 神 琳 地 变 为 了 正确 的 字 
符 形式 “ 老 马 ”"， 打 开 十 六 进 制 编辑 嚣 ， 可 以 看 出 二 进 制 还 是 COCF 
C2ED， 这 个 GB18030 相 当 于 假设 A 是 GB18030。 


这 个 例子 我 们 碰巧 第 一 次 惑 狂 对 了 。 实 际 中 ， 可 能 要 做 多 次 笠 
试 ， 过 程 是 类 似 的 ， 先 进行 编码 转换 (使 用 B 编 码 ，， 然 后 使 用 不 同 编 
码 方式 查看 (使 用 A 编码 ) ， 如 果 能 找到 看 上 去 对 的 形式 ， 束 恢复 了 。 
I ` 对 应 的 二 进 制 ， 以 及 按 A 编 码 解读 的 各 
区 工 .。 


表 2-9 ” 笑 试 不 同 编码 方式 进行 恢复 


TE TE 


81 30 86 38 81 30 88 33 81 30 


GB18030 Windows-1252 ?0 十 8?0`320 半 0… 
8730A8 AA 
81308638813088338130 
GB18030 Blgs 2222722 亦 
8730A8 AA 
81 308638813088338130 
GB18030 UTF-8 2028?0?32020?? 
8730A8 AA 


可 以 看 出 ， 第 一 行 是 正确 的 ， 也 就 是 说 原来 的 编码 其 实 是 A 即 
GB18030， 但 被 错误 解读 成 了 B 即 Windows-1252 了 。 


2. 使 用 Java 


下 面 我 们 来 看 如 何 使 用 Java 恢 复 乱码 。 天 于 使 用 Java 我 们 还 有 很 多 
知识 没有 介绍 ， 为 了 完整 性 起 见 ， 本 太一 并 列 出 相关 代码 ， 初 学 者 不 


明白 的 可 以 暂时 略 过 。Java 中 处 理 字符 串 的 类 有 String，String 中 有 我 们 
需要 的 两 个 重要 方法 。 


1) public byte[]getBytes (String charsetName) ， 这 个 方法 可 以 获 
取 一 个 字符 串 的 给 定编 码 格 式 的 二 进 制 形式 。 


2) public String (byte bytes[]，String charsetName) ， 这 个 构造 方 
法 以 给 定 的 二 进 制 数组 bytes 按 如 Nn 角 没 汶 个 字符 
囊 


将 A 看 作 GB18030， 将 B 看 作 Windows-1252， 进 行 恢复 的 Java 代 码 
如 下 所 示 : 


String str = "AiAi",; 
String newStr = new String(str.getBytes("windows-1252"),"GB18030"); 
System.out.printin(newstr); 


完 按照 B 编 码 (Windows-1252) 获取 字符 串 的 二 进 制 ， 然 后 按 A 编 
码 (GB18030) 解读 这 个 二 进 制 ， 得 到 一 个 新 的 字符 串 ， 然 后 输出 这 
个 字符 串 的 形式 ， 输 出 为 “ 老 马 ”。 


同样 ， 一 次 碰巧 惑 对 了 ， 实 际 中 ， 我 们 可 以 写 一 个 循环 ， 测 试 不 
同 的 A/B 编 码 中 的 结 来 形式 ， 如 代码 清早 2-1 所 示 。 


代码 清单 2-1 恢复 乱码 的 方法 


public static void recover(String str) 
throws UnsupportedEncodingException{ 
String[] charsets = new String[]t{ 
"windows-1252", "GB18030", "Big5", "UTF-8"}; 
for(int i=0;i<charsets.]length;i++){ 
for(int j=0;j<charsets.length;j++){ 


if(i!=j){ 
String s = new String(str. getBytes(charsets[i]),charsets[j]); 
System.out. rm 原来 编码 (A) 假 设 是 : " 


+charsets[j]+", 被 错误 解读 为 了 (B) : "+charsets[i]); 
System.out.printin(s); 
System.out.println(); 


以 上 代码 使 用 不 同 的 编码 格式 进行 测试 ， 如 采 输 出 有 正确 的 ， 那 
么 束 可 以 恢复 。 


可 以 看 出 ， 恢 复 的 尝 斌 需要 进行 很 多 次 ， 上 面 例子 尝试 了 常见 编 
码 GB18030、Windows 1252、Big5、UTF-8 共 12 种 组 合 。 这 4 种 编码 是 
常见 编码 ， 在 大 部 分 实际 应 用 中 应 该 够 了 。 如 果 有 其 他 编码 ， 可 以 增 
加 一 些 党 试 。 

不 是 所 有 的 乱码 形式 都 是 可 以 恢复 的 ， 如 果 形 式 中 有 很 多 不 能 识 
别 的 字符 (如 ? ) ， 则 很 难 恢复 。 另 外 ， 如 果 乱 码 是 由 于 进行 了 多 次 
解析 和 转换 错误 造成 的 ， 也 很 难 恢 复 。 


Dd hal 


通过 前 面 小 节 ， 我 们 应 该 对 字符 和 文本 的 编码 和 乱码 有 了 一 个 清 
蜥 的 认识 ， 但 前 面 小 慷 基 本 是 与 编程 语言 无 天 的 ， 我 们 还 是 不 知道 怎 
么 在 程序 中 处 理 字符 和 文本 。 本 方 讨论 在 Java 中 进行 字符 处 理 的 基础 
char，Java 中 还 有 Character、String、StringBuilder 等 类 用 于 文本 处 理 ， 
它们 的 基础 都 是 char， 我 们 在 第 7 章 再 介绍 这 些 类 。 


char 看 上 去 是 很 简单 的 ， 正 如 我 们 在 1.2 广 所 说 ，char 用 于 表示 一 
字符 ， 这 个 字符 可 以 是 中 文字 符 ， 也 可 以 是 英文 字符 。 赋 值 时 把 常 
字符 用 单 引 号 括 起 来 ， 例 如 : 


但 为 什么 字符 类 型 也 可 以 进行 算术 运算 和 比较 呢 ? 它 的 本 质 到 发 
征 什 么 呢 ? 


在 Java 内 部 进行 字符 处 理 时 ， 采 用 的 都 是 Unicode， 有 具体 编码 格式 
是 UTF-16BE。 简 单 回 顾 一 下 ，UTF-16 使 用 两 个 或 4 个 字 节 表示 一 个 字 
符 ，Unicode 编 号 范围 在 65536 以 内 的 占 两 个 字 节 ， 超 出 范围 的 占 4 个 字 
DD | 再 输出 低位 字 节 ， 这 与 整数 的 内 存 表 示 
是 一 致 的 。 


char 本 质 上 是 一 个 固定 占用 两 个 字 市 的 无 符号 正 整数 ， 这 个 正 整 
数 对 应 于 Unicode 编 号 ， 用 于 表示 那个 Unicode 编 号 对 应 的 字符 。 由 于 
固定 占用 两 个 字 节 ，char 只 能 表示 Unicode 编 号 在 65536 以 内 的 字符 ， 
而 不 能 表示 超出 范围 的 字符 。 那 超出 范围 的 字符 怎么 表示 呢 ? 使 用 两 
个 char。 类 Character、String 有 一 些 相 关 的 方法 ， 我 们 到 第 7 章 再 介 


绍 。 


在 这 个 认识 的 基础 上 ， 我 们 再 来 看 下 char 的 一 些 行为 。 
char 有 多 种 赋值 方式 : 


。 Char c = 'A' 
.Char € = 可! 
char c = 39532 

. Char c = Ox9a6c 

. Char c = '\u9a6c' 


QI 人 Nm 


第 1 种 赋值 方式 是 最 常见 的 ， 将 一 个 能 用 ASCII 码 表示 的 字符 赋 给 
一 个 字符 变量 。 第 2 种 赋值 方式 也 很 常见 ， 但 这 里 是 个 中 文字 符 ， 需 要 
注意 的 是 ， 直 接 写 字符 常量 的 时 候 应 该 注意 文件 的 编码 ， 比 如 ，GBK 
编码 的 代码 文件 按 UTF-8 打 开 ， 字 符 会 变 成 乱码 ， 赋 值 的 时 候 是 按 当 
前 的 编码 解读 方式 ， 将 这 个 字符 形式 对 应 的 Unicode 编 号 值 赋 给 变 
量 ,“ 马 ?对 应 的 Unicode 编 号 是 39532， 所 以 第 2 种 赋值 方式 和 第 3 种 赋 
值 方 式 是 一 样 的 。 第 3 种 赋值 方式 是 直接 将 十 进 制 的 常量 赋 给 字符 。 第 
4 种 赋值 方式 是 将 十 六 进 制 常 量 赋 给 字符 ， 第 5 种 赋值 方式 是 按 Unicode 
字符 形式 。 所 以 ， 第 2、3、4、5 种 赋值 方式 都 是 一 样 的 ， 本 质 都 是 将 


人 


Unicode 编 号 39532 赋 给 了 字符 。 


由 于 char 本 质 上 是 一 个 整数 ， 所 以 可 以 进行 整数 能 做 的 一 些 运 
算 ， 在 进行 运算 时 会 被 看 作 int， 但 由 于 char 占 两 个 字 节 ， 运 算 结 果 不 
能 直接 赋值 给 char 类 型 ， 需 要 进行 强制 类 型 转换 ， 这 和 byte、short 参 与 
整数 运算 是 类 似 的 。char 类 型 的 比较 就 是 其 Unicode 编 号 的 比较 。 


char 的 加 减 运算 就 是 按 其 Unicode 编 号 进行 运算 ， 一 般 对 字符 做 加 
减 运算 没什么 意义 ， 但 ASCII 码 字符 是 有 意义 的 。 比 如 大 小 写 转换 ， 
大 写 A~Z 的 编号 是 65~90， 小 写 a~z 的 编号 是 97~122， 正 好 相差 
32， 所 以 大 写 转 小 写 只 需 加 32， 而 小 写 转 大 写 只 需 减 32。 加 减 运算 的 
男 一 个 应 用 是 加 密 和 解密， 将 字符 进行 某 种 可 逆 的 数学 运算 可 以 做 加 


解密 。 


char 的 位 运算 可 以 看 作 是 对 应 整数 的 位 运算 ， 只 是 它 是 无 符号 
数 ， 也 就 是 说 ， 有 符号 右 移 >> 和 无 符号 右 移 >>> 的 结果 是 一 样 的 。 既 
0 查看 char 的 二 进 制 表示 ， 同 样 可 以 用 Integer 的 方 
法 ， 如 下 所 示 : 


char c = "与 '， 
System,.out,println(Integer,toBinaryString(c) )， 


输出 为 : 


1001101001101100 


至 此 ， 天 于 整数 、 小 数 以 及 字符 的 二 进 制 表示 就 介绍 完了 ， 下 一 
章 让 我 们 一 起 来 探索 类 的 世界 。 
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第 3 章 ”类 的 基础 


程序 主要 就 是 数据 以 及 对 数据 的 操作 ， 为 方便 理解 和 操作 ， 高 级 
语言 使 用 数据 类 型 这 个 概念 ， 不 同 的 数据 类 型 有 不 同 的 特征 和 操作 ， 
Java 定 义 了 8 种 基本 数据 类 型 : 4 种 整 型 byte、short、int、long， 两 种 浮 
点 类 型 float、double， 一 种 真 假 类 型 boolean， 一 种 字符 类 型 char。 其 他 
类 型 的 数据 都 用 类 这 个 概念 表达 。 


类 比较 复杂 ， 本 章 主 要 介绍 类 的 一 些 基础 知识 ， 具 体 分 为 3 下: 
3.1 攻 主要 介绍 类 的 基本 概念 ;3.2 节 主要 通过 一 些 例 子 来 演示 如 何 将 一 
些 现实 概念 和 问题 通过 类 以 及 类 的 组 合 来 表示 和 处 理 ; 3.3 世 介绍 类 代 
码 的 组 织 机 制 。 


3.1 类 的 基本 概念 


在 第 1 章 ， 我 们 暂时 将 类 看 作画 数 的 容器 ， 在 某 些 情况 下 ， 类 也 确 
实 只 是 画 数 的 容器 ， 但 类 更 多 表示 的 是 目 定 义 数据 类 型 。 本 市 我 们 先 
从 容器 的 角度 ， 然 后 从 目 定 义 数 据 类 型 的 角度 介绍 类 。 


3.1.1 玉 数 容器 


我 们 看 个 例子 一 Java API 中 的 类 Math， 它 里 面 主 要 包含 了 若干 数 
学 函数 ， 表 3-1 列 出 了 其 中 一 些 。 


要 使 用 这 些 函 数 ， 直 接 在 前 面 加 Math. 即 可 ， 例 如 Math.abs (-1) 
返回 1。 这 些 函 数 都 有 相同 的 修饰 符 : public static 。 static 表 示 类 方法 ， 
也 叫 静 态 方 法 ， 与 类 方法 相对 的 是 实例 方法 。 实 例 方法 没有 static 修 饰 
符 ， 必 须 通过 实例 或 者 对 象 调 用 ， 而 类 方法 可 以 直接 通过 类 名 进行 调 
。public 表 示 这 些 琅 数 是 公开 的 ， 可 以 在 任何 地 方 
被 外 部 调用 。 


表 3-1 Math 类 的 利用 函数 


Math 函数 Math 函数 功 能 
int round(float a) int abs(int a) 绝对 值 
double sqrt(double a) int max(int a, int b) | 最 大 值 


double ceil(double a) 向 上 有 取 整 double log(double a) | 自然 对 数 


double floor(double a) double random() 产生 一 个 大 于 等 于 0 小 于 1 的 随机 数 


double pow(double a, double b) a 的 b 次 方 


与 public 相 对 的 是 private。 如 果 是 private， 则 表示 私有 ， 这 个 函数 
只 能 在 同一 个 类 内 被 别 的 函数 调用 ， 而 不 能 被 外 部 的 类 调用 。 在 Math 
类 中 ， 有 一 个 函数 Random initRNG () 就 是 private 的 ， 这 个 函数 被 
和 () 调用 以 生成 随机 数 ， 但 不 能 在 Math 类 以 外 的 地 
被 调用 。 


将 函数 声明 为 private 可 以 避免 该 画 数 被 外 部 类 误 用 ， 调 用 者 可 以 请 
荡 地 知道 哪些 画 数 是 可 以 调用 的 ， 哪 些 是 不 可 以 调用 的 。 类 实现 音 通 


过 private 函 数 封 装 和 隐藏 内 部 实现 细节 ， 而 调用 者 只 需要 关心 public 职 
可 以 了 。 可 以 说 ， 通 过 private 封 美和 隐藏 内 部 实现 细 和 ， 避 免 被 误 操 
作 ， 是 计算 机 程序 的 一 种 基本 思维 方式 。 


除了 Math 类 ， 我 们 再 来 看 一 个 例子 Arrays。Arrays 里 面包 含 很 多 与 
数组 操作 相关 的 曾 数 ， 表 3-2 列 出 了 其 中 一 些 。 


表 3-2 Arrays 类 的 一 些 函 数 


Arrays 函数 功 能 
void sort(int[] a) 排序 ， 按 升序 排 ， 整 数 数组 
void sort(double[] a) 排序 ， 按 升序 排 ， 浮 点 数 数组 
int binarySearch(long[] a, long key) -分 查找 ， 数 组 已 按 升序 排列 
void fill(int[] a, int val) 给 所 有 数组 元 素 赋 相同 的 值 
int[] copyOf(int[] original, int newLength) 数组 复制 
boolean equals(char[] a, char[] a2) 判 晰 两 个 数组 是 否 相 同 


这 里 将 类 看 作画 数 的 容器 ， 更 多 的 是 从 语言 实现 的 角度 看 ， 从 概 
念 的 角度 看 ，Math 和 Arrays 也 可 以 看 作 自 定义 数据 类 型 ， 分 别 表示 数学 
和 数组 类 型 ， 其 中 的 public static 芳 数 可 以 看 作 类 型 能 进行 的 控 作 。 接 下 
来 更 为 详细 地 讨论 目 定 义 数据 类 型 。 


3.1.2” 目 定 义 数 据 类 型 


我 们 将 类 看 作 目 定义 数据 类 型 ， 所 谓 目 定义 数据 类 型 束 是 除了 8 种 
基本 类 型 以 外 的 其 他 类 型 ， 用 于 表示 和 处理 基本 类 型 以 外 的 其 他 数 
据 。 一 个 数据 类 型 由 其 包含 的 属性 以 及 该 类 型 可 以 进行 的 操作 组 成 ， 
属性 义 可 以 分 为 是 类 型 本 映 具 有 的 属性 ， 还 是 一 个 具体 实例 具有 的 属 
性 ， 同 样 ， 操 作 也 可 以 分 为 是 类 型 本 吴 可 以 进行 的 操作 ， 还 是 一 个 有 具 
体 实 例 可 以 进行 的 操作 。 


这 样 ， 一 个 数据 类 型 束 主 要 由 4 部 分 组 成 : 
类 型 本 吴 具 有 的 属性 ， 通 过 类 变量 体现 。 
-类 型 本 吴 可 以 进行 的 操作 ， 通 过 类 方法 体现 。 


-类 型 实例 具有 的 属性 ， 通 过 实例 变量 体现 。 
-类 型 实例 可 以 进行 的 操作 ， 通 过 实例 方法 体现 。 


不 过 ， 对 于 一 个 具体 类 型 ， 每 一 个 部 分 不 一 定 都 有 ，Arrays 类 融 只 
有 类 方法 。 

类 变量 和 实例 变量 都 叫 成 员 变 量 ， 也 束 是 类 的 成 员 ， 类 变量 也 叫 
静态 变量 或 静态 成 员 变 量 。 类 方法 和 实例 方法 都 叫 成 员 方 法 ， 也 都 是 
类 的 成 员 ， 类 方法 也 叫 静 态 方 法 。 


类 方法 我 们 上 面 已 经 看 过 了 ，Math 和 Arrays 类 中 定义 的 方法 就 是 类 
0 
实例 法。 


1. 类 变量 


类 型 本 吴 具 有 的 属性 通过 类 变量 体现 ， 经 肖 用 于 表示 一 个 类 型 中 
的 币 量 。 比 如 Math 类 ， 定 义 了 两 个 数学 中 利用 的 季 量 ， 如 下 所 示 : 


public static final double E = 2.7182818284590452354 
public static final double PI = 3.14159265358979323846; 


E 表 示 数 学 中 自然 对 数 的 底数 ， 自 然 对 数 在 很 多 学 科 中 有 重要 的 意 
义 ; PI 表示 数学 中 的 圆周 率 。 与 类 方法 一 样 ， 类 变量 可 以 直接 通过 类 
名 访问 ， 如 Math.PI。 


这 两 个 变量 的 修饰 符 也 都 有 public static，public 表 示 外 部 可 以 访 
问 ，static 表 示 是 类 变量 。 与 public 相 对 的 也 是 private， 表 示 变 量 只 能 在 
类 内 被 访问 。 与 static 相 对 的 是 实例 变量 ， 没 有 static 修 饰 伯 。 


这 里 多 了 一 个 修饰 符 final，final 在 修饰 变量 的 时 候 表 示 第 量 ， 即 变 
量 赋值 后 就 不 能 再 修改 了 。 使 用 final 可 以 避免 误 操 作 ， 比 如 ， 如 果 有 人 
不 小 心 将 Math.PI 的 值 改 了 ， 那 么 很 多 相关 的 计算 束 会 出 锯 。 男 外 ， 
Java 编 译 右 可 以 对 final 变 量 进行 一 些 特别 的 优化 。 所 以 ， 如 琳 数 据 赋值 
后 束 不 应 该 再 变 了 ， 束 加 final 修 饰 符 。 


表示 类 变量 的 时 候 ，static 修 饰 符 是 必需 的 ， 但 public 和 final 都 不 是 
必需 的 。 


2. 实 例 变 量 和 实例 方法 


所 请 实例 ， 字 面 意 思 束 是 一 个 实际 的 例子 。 实 例 变量 表示 具体 的 
实例 所 具有 的 属性 ， 实 例 方 法 表示 具体 的 实例 可 以 进行 的 操作 。 如 采 
将 微 信 订阅 号 看 作 一 个 类 型 ， 那 “ 老 马 说 编程 ”订阅 号 承 是 一 个 实例 ， 
订阅 号 的 头像 、 功 能 介绍 、 发 布 的 文章 可 以 看 作 实例 变量 ， 而 修改 头 
像 、 修 改 功 能 介绍 、 发 布 新 文章 可 以 看 作 实例 方法 。 与 基本 类 型 对 
比 , “int a; ”这 个 语句 中 ，int 就 是 类 型 ， 而 a 就 是 实例 。 


接 下 来 ， 我 们 通过 定义 和 使 用 类 来 进一步 理解 自 定义 数据 类 型 。 


.13 定义 第 一 个 半 


我 们 定义 一 个 简单 的 类 ， 表 示 在 平面 坐标 轴 中 的 一 个 扣 ， 代 码 如 


class Point { 
public int x; 
public int y; 
public double distance(){ 
return Math.sqrt(x*x+ty*y); 
} 
和 


我 们 来 解释 一 下 : 
public class Point 


表示 类 型 的 名 字 是 Point， 是 可 以 被 外 部 公开 访问 的 。 这 个 public 修 
饰 似乎 是 多 余 的 ， 不 能 被 外 部 访问 还 能 有 什么 用 ? 在 这 里 ， 确 实 不 能 
用 private 修 饰 Point。 但 修饰 符 可 以 没有 ( 即 留 空 ) ， 表 示 一 种 包 级 别 
的 可 见 性 ， 关 于 包 ，3.3 节 再 介绍 。 男 外 ， 类 可 以 定义 在 一 个 类 的 内 
部 ， 这 时 可 以 使 用 private 修 饰 符 ， 关 于 内 部 类 我 们 在 第 5 章 介绍 。 


public int x; 
public int y; 


定义 了 两 个 实例 变量 x 和 y， 分 别 表示 x 坐标 和 y 坐 标 ， 与 类 变量 类 
似 ， 修 饰 从 也 有 public 或 private 修 饰 从 ， 表 示 含 义 类 似 ，public 表 示 可 被 
外 部 访问 ， 而 private 表 示 私 有 ， 不 能 直接 被 外 部 访问 ， 实 例 变 量 不 能 


static 修 炳 符 。 


public double distance(){ 
return Math.sqrt(x*x+ty*y); 
} 


定义 了 实例 方法 distance， 表 示 该 点 到 坐标 原点 的 距离 。 该 方法 可 
以 直接 访问 实例 变量 x 和 y， 这 十 实例 方法 和 类 方法 的 最 大 区 别 。 实 例 
方法 直接 访问 实例 变量 ， 到 确 是 什么 意思 呢 ? 其 实 ， 在 实例 方法 中 ， 
有 一 个 隐 含 的 参数 ， 这 个 参数 束 古 当前 操作 的 实例 目 己 ， 直 接 操 作 实 
0 

RR? 


-类 方法 只 能 访问 类 变量 ， 不 能 访问 实例 变量 ， 可 以 调用 其 他 的 类 
方法 ， 不 能 调用 实例 方法 。 

:实例 方法 既 能 访问 实例 变量 ， 也 能 访问 类 变量 ， 既 可 以 调用 实例 
方法 ， 也 可 以 调用 类 方法 。 

如 琳 这 些 让 你 感到 困惑 ， 没 有 关系 ， 关 于 实例 方法 和 类 方法 的 更 


多 细 证 ， 后 续 会 进一步 介绍 。 


3.1.4 ”使 用 第 一 个 类 


定义 了 类 本 身 和 定义 了 一 个 范 数 类 似 ， 本 身 不 会 做 什么 事情 ， 不 
会 分 配 内 存 ， 也 不 会 执行 代码 。 方 法 要 执行 需要 被 调用 ， 而 实例 方法 
被 调用 ， 首 先 需要 一 个 实例 。 实 例 也 称 为 对 象 ， 我 们 可 能 会 交替 使 
用 。 下 面 的 代码 演示 了 如 何 使 用 : 


public static void main(String[] args) { 
Point p = new Point(); 
p.x = 2; 


p,y = 3; 
System.out.printlin(p.distance()); 


我 们 解释 一 下 ; 
Point p = new Point(); 


这 个 语句 包 舍 了 Point 类 型 的 变量 声明 和 峰值 ， 它 可 以 分 为 两 部 


1 Point p; 
2 p= new Point(); 


Point p 声 明了 一 个 变量 ， 这 个 变量 叫 p， 和 是 Point 类 型 的 。 这 个 变量 
和 数组 变量 是 类 似 的 ， 部 有 两 块 内 存 ， 一块 存放 实际 内 容 ， 一 块 存放 
实际 内 容 的 位 置 。 声 明 变 量 本 映 只 会 分 配 存 放 位 置 的 内 存 空间 ， 这 块 
空间 还 没有 指 疝 任何 实际 内 容 。 因 为 这 种 变量 和 数组 变量 本 喘 不 存储 
数据 ， 而 只 是 存储 实际 内 容 的 位 置 ， 它 们 也 都 称 为 引用 类 型 的 变量 。 


p=new Point () ; 创建 了 一 个 实例 或 对 象 ， 然 后 赋值 给 了 Point 类 
型 的 变量 p， 它 至 少 做 了 两 件 事 : 


1) 分 配 内 存 ， 以 存储 新 对 象 的 数据 ， 对 象 数据 包括 这 个 对 象 的 属 
性 ， 具 体 包括 其 实例 变量 x 和 y 。 


2) 给 实例 变量 设置 默认 值 ，int 类 型 默认 值 为 0。 


与 方法 内 定义 的 局 部 变量 不 同 ， 在 创建 对 象 的 时 候 ， 所 有 的 实例 
变量 都 会 分 配 一 个 默认 值 ， 这 与 创建 数组 的 时 候 是 类 似 的 ， 数 值 类 型 
变量 的 默认 值 是 0，boolean 是 false，char 是 “\u0000”， 引 用 类 型 变量 都 
是 nul。null 是 一 个 特殊 的 值 ， 表 示 不 指向 任何 对 象 。 这 些 默 认 值 可 以 
修改 ， 我 们 稍 后 介绍 。 


给 对 象 的 变量 赋值 ， 语 法 形式 是 : < 对 象 变量 名 >.< 成 员 名 >。 


System.out,.println(p,distance() )， 


调用 实例 方法 distance， 并 输出 结果 ， 语 法 形式 是 ，< 对 象 变量 名 > 
< 法 名 >。 实例 方法 内 对 实 便 变量 的 操作 ， 实 际 操 作 的 就是 p 这 个 对 和 


我 们 在 介绍 基本 类 型 的 时 候 ， 先 定义 数据 ， 人 然后 赋值 ， 最 后 是 操 
作 ， 目 定义 类 型 与 此 类 似 : 


:Point p=new Point () ; 是 定义 数据 并 设置 默认 值 。 
D.x=2; p.y=3; 古 赋 信 。 
p.distance () 是 数据 的 操作 。 


可 以 看 出 ， 对 实例 变量 和 实例 方法 的 访问 都 通过 对 象 进行 ， 通 过 
对 象 来 访问 和 操作 其 内 部 的 数据 钙 一 种 基本 的 面向 对 象 思维 。 本 例 
中 ， 我 们 通过 对 象 直接 操作 了 其 内 部 数据 x 和 y， 这 古 一 个 不 好 的 习 
惯 ， 一 般 而 言 ， 不 应 该 将 实例 变量 声明 为 public， 而 只 应 该 通过 对 象 的 
方法 对 实例 变量 进行 操作 。 这 也 是 为 了 减少 误 操 作 ， 和 直接 访问 变量 没 
有 妇 污 进行 参数 从 下 和 兵制， 而 通过 方法 修改 ， 可 以 在 方法 中 进行 检 


3.1.5 “变量 默认 值 


之 前 我 们 说 实例 变量 都 有 一 个 默认 值 ， 如 有 果 布 望 修改 这 个 默认 
值 ， 可 以 在 定义 变量 的 同时 融 赋 值 ， 或 者 将 代码 放 入 初始 化 代码 块 
中 ， 代 码 块 用 {} 包 围 ， 如 下 所 示 : 


int x = 1; 
int y; 
{ 

y= 2; 


x 的 默认 值 设 为 了 1，y 的 默认 值 设 为 了 2。 在 新 建 一 个 对 象 的 时 
候 ， 会 先 调用 这 个 初始 化 ， 然 后 才 会 执行 构造 方法 中 的 代码 ， 关 于 构 
造 方法 ， 我 们 稍 后 介绍 。 


静态 变量 也 可 以 这 样 初 始 化 : 


static int STATIC_ONE = 1; 
static int STATIC_TWO; 
static 


STATIC_TWO = 2; 


STATIC_TWO=2; 语句 外 面包 了 一 个 static{}， 这 叫 静 态 初 始 化 代 
码 块 。 静 态 初始 化 代码 块 在 类 加 载 的 时 候 执行 ， 这 是 在 任何 对 象 创建 
之 前 ， 且 只 执行 一 次 。 


3.1.6_ private 变量 


前 面 我 们 说 一 般 不 应 该 将 实例 变量 声明 为 public， 下 面 我 们 修改 一 
下 类 的 定义 ， 将 实例 变量 定义 为 private， 通 过 实例 方法 来 操作 变量 ， 如 
代码 清单 3-1 所 示 。 


代码 清单 3-1 ”Point 类 定义 一 一 实例 变量 定义 为 private 


class Point { 
private int x; 
private int y; 
public void setx(int x) { 
this.x = x; 


} 
public void setY(int y) { 
this.y = y; 


public int getX() { 
return x; 


} 
public int getY() { 
return y; 


} 
public double distance() { 

return Math.sqrt(x * x +y * y); 
} 


} 


这 个 定义 中 ， 我 们 加 了 4 个 方法 ，setX/setY 用 于 设置 实例 变量 的 
值 ，getX/getY 用 于 获取 实例 变量 的 值 。 


这 里 面 需要 介绍 的 是 this 这 个 关键 字 。this 表 示 当 前 实例 ， 在 语句 
this.x=x; 中 ，this.x 表 示 实 例 变 量 x， 而 右边 的 x 表示 方法 参数 中 的 x。 
前 面 我 们 提 人 到， 在 实例 方法 中 ， 有 一 个 隐 仿 的 参数 ， 这 个 参数 束 是 
this， 没 有 上 收 义 的 情况 下 ， 可 以 直接 访问 实例 变量 ， 在 这 个 例子 中 ， 两 
个 变量 名 都 叫 x， 则 需要 通过 加 上 this 来 消除 卜 义 。 


这 4 个 方法 看 上 去 是 非常 多 余 的 ， 直 接 访 问 变 量 不 是 更 简洁 吗 ? 而 
且 第 1 章 我 们 也 说 过 ， 男 数 调用 是 有 成 本 的 。 在 这 个 例子 中 ， 意 义 确 实 
不 太 大 ， 实 际 上 ，Java 编 译 器 一 般 也 会 将 对 这 几 个 方法 的 调用 转换 为 直 
接 访问 实例 变量 ， 而 避免 贸 数 调用 的 开销 。 但 在 很 多 情况 下 ， 通 过 函 
数 调用 可 以 封装 内 部 数据 ， 避 免 误 操作 ， 我 们 一 般 还 是 不 将 成 员 变 量 
定义 为 public 。 


使 用 这 个 类 的 代码 如 下 : 


public static void main(String[] args) { 
Point p = new Point(); 
p.setx(2); 
p.setY(3); 
System.out.printlin(p.distance()); 

} 


上 述 代码 将 对 实例 变量 的 直接 访问 改 为 了 方法 调用 。 
3.1.7 ”构造 方法 


在 初始 化 对 象 的 时 候 ， 前 面 我 们 都 是 直接 对 每 个 变量 赋值 ， 有 一 
个 更 简单 的 方式 对 实例 变量 赋 初 值 ， 殉 是 构造 方法 ， 我 们 爷 看 下 代 
码 。 在 Point 类 定义 中 增加 如 下 代码 : 


public Point(){ 
this(0,o0); 


public Point(int x, int y){ 
this.x = x; 
this.y = y; 

} 


这 两 个 就 是 构造 方法 ， 构 造 方法 可 以 有 多 个 。 不 同 于 一 般 方法 ， 
构造 方法 有 一 些 特殊 的 地 方 : 


1) 名 称 是 固定 的 ， 与 类 名 相同 。 这 也 容易 理解 ， 靠 这 个 用 户 和 
Java 系 统 就 都 能 容易 地 知道 哪些 是 构造 方法 。 


he i 
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与 普通 方法 一 样 ， 构 造 方法 也 可 以 重 载 。 第 二 个 构造 方法 是 比较 
容易 理解 的 ， 使 用 this 对 实例 变量 赋值 。 


我 们 解释 下 第 一 个 构造 方法 ，this (0，0) 的 意思 是 调用 第 二 个 构 
造 方法 ， 并 传递 参数 “0，0”， 我 们 前 面 解释 说 this 才 示 当 前 实例 ， 可 以 
通过 this 访 问 实例 变量 ， 这 是 this 的 第 二 个 用 法 ， 用 于 在 构造 方法 中 调 
用 其 他 构造 方法 。 


这 个 this 调 用 必须 放 在 第 一 行 ， 这 个 规定 也 是 为 了 避免 误 操 作 。 构 
造 方 法 是 用 于 初始 化 对 象 的 ， 如 采 要 调用 别 的 构造 方法 ， 先 调 别 的 ， 
然后 根据 情况 目 己 再 做 调整 ， 而 如 末 目 己 先 初始 化 了 一 部 分 ， 再 调 别 
的 ， 目 己 的 修改 可 能 束 被 窗 盖 了 。 

这 个 例子 中 ， 不 市 参数 的 构造 方法 通过 this (0，0) 又 调用 了 第 二 
个 构造 方法 ， 这 个 调用 是 多 余 的 ， 因 为 x 和 y 的 默认 值 束 是 0， 不 需要 再 
单独 赋值 ， 我 们 这 里 主要 是 演示 其 语法 。 


我 们 来 看 下 如 何 使 用 构造 方法 ， 代 码 如 下 : 


Point p = new Point(2,3); 


这 个 调用 束 可 以 将 实例 变量 x 和 y 的 值 设 为 2 和 3。 前面 我 们 介绍 new 
Point () 的 时 候 说 ， 它 至 少 做 了 两 件 事 ， 一 件 是 分 配 内 存 ， 男 一 件 是 
给 实例 变量 设置 默认 值 ， 这 里 我 们 需要 加 上 一 件 事 ， 就 是 调用 构造 方 
法 。 调 用 构造 方法 是 new 操 作 的 一 部 分 。 

通过 构造 方法 ， 可 以 更 为 简洁 地 对 实例 变量 进行 赋值 。 关 于 构造 
方法 ， 下 面 我 们 讨论 两 个 细节 概念 ， 一 个 是 默认 构造 方法 ， 男 一 个 是 
私有 构造 方法 。 


1. 默 认 构 造 方法 


每 个 类 都 至 少 要 有 一 个 构造 方法 ， 在 通过 new 创 建 对 象 的 过 程 中 会 
极 调用。 但 构造 方法 如 果 没 什么 操作 要 做 ， 可 以 省 略 。Java 编 详 估 会 目 
动 生 成 一 个 默认 构造 方法 ， 也 没有 具体 操作 。 但 一 旦 定义 了 构造 方 
法 ，Java 束 不 会 再 自动 生成 默认 的 ， 具 体 什 么 意思 呢 ? 在 这 个 例子 中 ， 
如 采 我 们 只 定义 了 第 二 个 构造 方法 〈 融 参数 的 ) ， 则 下 面 语句 : 


Point p = new Point(); 


束 会 报 锯 ， 因 为 找 不 到 不 融 参 数 的 构造 方法 。 


为 什么 Java 有 时 候 目 动 生成 ， 有 时 候 不 生成 呢 ? 在 没有 定义 任何 构 
造 方法 的 时 候 ，Java 认 为 用 户 不 需要 ， 所 以 就 生成 一 个 空 的 以 被 new 过 
程 调用 ; 定义 了 构造 方法 的 时 候 ，Java 认 为 用 户 知道 自己 在 干什么 ， 认 
为 用 户 是 有 意 不 想 要 不 融 参 数 的 构造 方法 ， 所 以 不 会 目 动 生成 。 


2. 私 有 构造 方法 


构造 方法 可 以 是 私有 方法 ， 即 修饰 符 可 以 为 private， 为 什么 需要 私 
有 构造 方法 呢 ? 大 致 可 能 有 这 人 么 几 种 场景 : 


1) 不 能 创建 类 的 实例 ， 类 只 能 被 静态 访问 ， 如 Math 和 Arrays 类 ， 
它们 的 构造 方法 就 是 私有 的 。 


2) 能 创建 类 的 实例 ， 但 只 能 被 类 的 静态 方法 调用 。 有 一 种 常见 的 
场景 : 类 的 对 象 有 但 是 只 能 有 一 个 ， 即 单 例 (单个 实例 ) 。 在 这 种 场 
景 中 ， 对 象 是 通过 静态 方法 获取 的 ， 而 静态 方法 调用 私有 构造 方法 创 
建 一 个 对 象 ， 如 果 对 象 已 经 创建 过 了 ， 就 重用 这 个 对 象 。 


3) 只 是 用 来 被 其 他 多 个 构造 方法 调用 ， 用 于 减少 重复 代码 。 


3.1.8 类 和 对 象 的 生命 周期 


了 解 了 类 和 对 象 的 定义 与 使 用 ， 下 面 我 们 再 从 程序 运行 的 角度 理 
解 下 类 和 对 象 的 生命 周期 。 


在 程序 运行 的 时 候 ， 当 第 一 次 通过 new 创 建 一 个 类 的 对 象 时 ， 或 者 
直接 通过 类 名 访问 类 变量 和 类 方法 时 ，Java 会 将 类 加 载 进 内 存 ， 为 这 个 
类 分 配 一 块 空间 ， 这 个 空间 会 包括 类 的 定义 、 它 的 变量 和 方法 信息 ， 
同时 还 有 类 的 静态 变量 ， 并 对 静态 变量 赋 初 始 值 。 下 一 章 会 进一步 介 
绍 有 关 细 节 。 


类 加 载 进 内 存 后 ， 一 般 不 会 释放 ， 直 到 程序 结束 。 一 般 情 况 下 ， 
类 只 会 加 载 一 次 ， 所 以 静态 变量 在 内 存 中 只 有 一 份 。 


当 通 过 new 创 建 一 个 对 象 的 时 候 ， 对 象 产生 ， 在 内 存 中 ， 会 存储 这 
个 对 象 的 实例 变量 值 ， 每 做 new 操 作 一 次 ， 就 会 产生 一 个 对 象 ， 束 会 有 
一 份 独立 的 实例 变量 。 


每 个 对 象 除了 保存 实例 变量 的 值 外 ， 可 以 理解 为 还 保存 着 对 应 类 
于 即 关 的 地 址 这 样 ， 通 过 对 能 知 道 它 的 类， 访问 公关 的 变量 和 方 


实例 方法 可 以 理解 为 一 个 静态 方法 ， 只 是 多 了 一 个 参数 this。 通 过 
对 象 调用 方法 ， 可 以 理解 为 就 是 调用 这 个 静态 方法 ， 并 将 对 象 作 为 参 
数 传 给 this 。 


对 象 的 释放 是 被 Java 用 垃圾 回收 机 制 管 理 的 ， 大 部 分 情况 下 ， 我 们 
不 用 太 操 心 ， 当 对 和 象 不 再 个 使 用 的 时 候 会 被 目 动 释放 。 


具体 来 说 ， 对 象 和 数组 一 样 ， 有 两 块 内 存 ， 保 存 地 址 的 部 分 分 配 
在 栈 中 ， 而 保存 实际 内 容 的 部 分 分 配 在 扒 中 。 栈 中 的 内 存 是 自动 管理 
的 ， 函 数 调 用 入 栈 束 会 分 配 ， 而 出 栈 束 会 释放 。 


堆 中 的 内 存 古 被 垃圾 回收 机 制 管理 的 ， 当 没有 活 唉 变量 指 癌 对 象 
的 时 候 ， 对 应 的 堆 空间 束 可 能 被 释 放 ， 具 体 释 放 时 间 是 Java 虚 拟 机 目 己 
决定 的 。 活 路 变量 束 古 已 加 载 的 类 的 类 变量 ， 以 及 栈 中 所 有 的 变量 。 


引 .1 ”小结 


本 节 我 们 主要 从 自 定义 数据 类 型 的 角度 介绍 了 类 ， 谈 了 如 何 定 义 
和 使 用 类 。 目 定义 类 型 由 类 变量 、 类 方法 、 实 例 变量 和 实例 方法 组 
和 土 久 同期。 


通过 类 实现 目 定 义 数据 类 型 ， 封 小 该 类 型 的 数据 所 有 具有 的 属性 和 
操作 ， 隐 藏 实现 细 证 ， 从 而 在 更 高 的 层次 (类 和 对 和 象 的 层次 ， 而 非 基 
本 数据 类 型 和 函数 的 层次 ) 上 考虑 和 操作 数据 ， 是 计算 机 程序 解决 复 
杂 问 题 的 一 种 重要 的 思维 方式 。 

本 节 提 到 了 多 个 关键 子 ， 这 里 汇总 一 下 。 

1) public: 可 以 修饰 类 、 类 方法 、 类 变量 、 实 例 变 量 、 实 例 方 
法 、 构 造 方法 ， 表 示 可 被 外 部 访问 。 

2) private: 可 以 修饰 类 、 类 方法 、 类 变量 、 实 例 变 量 、 实 例 方 
法 、 构 造 方 法 ， 表 示 不 可 以 被 外 部 访问 ， 只 能 在 类 内 部 被 使 用 。 


3) static: 修饰 类 变量 和 类 方法 ， 它 也 可 以 修饰 内 部 类 (5.3 市 介 


4) this: 表示 当前 实例 ， 可 以 用 于 调用 其 他 构造 方法 ， 访 问 实例 
变量 ， 访 问 实 例 方 法 。 


5) final: 修饰 类 变量 、 实 例 变 量 ， 表 示 只 能 被 赋值 一 次 ， 也 可 以 
修饰 实例 方法 和 局 部 变量 (下 章 会 进一步 介绍 ) 。 


本 市 介绍 的 Point 类 ， 其 属性 只 有 基本 数据 类 型 ， 下 市 介绍 类 的 组 
合 ， 以 表达 更 为 复杂 的 概念 。 


32 关 的 时 全 


程序 是 用 来 解决 现实 问题 的 ， 将 现实 中 的 概念 映射 为 程序 中 的 概 
念 ， 是 初学 编程 过 程 中 的 一 步 跨越 。 本 市 通过 一 些 例子 来 演示 如 何 将 
一 些 现 实 概念 和 问题 通过 类 以 及 类 的 组 合 来 表示 和 处 理 ， 涉 及 的 概念 
`“ 电 商 、 人 之 间 的 血缘 关系 以 及 计算 机 中 的 文件 和 目 


我 们 先 介 绍 两 个 基础 类 String 和 Date， 它 们 都 是 Java API 中 的 类 ， 
分 别 表示 文本 字符 串 和 日 期 。 


3.2.1 String 和 Date 
String 是 Java API 中 的 一 个 类 ， 表 示 多 个 字符 ， 即 一 段 文本 或 字符 
串 ， 它 内 部 是 一 个 char 的 数组 ， 提 供 了 若干 方法 用 于 操作 字符 串 。 
String 可 以 用 一 个 字符 串 常量 初始 化 ， 字 符 串 常量 用 双 引 号 括 起 来 


(注意 与 字符 常量 区 别 ， 字 符 常 量 是 用 单 引 号 ) 。 例 如 ， 如 下 语句 声 
明了 一 个 String 变 量 name， 并 赋值 为 “ 老 马 说 编程 >。 


String name = " 老 马 说 编程 " ; 


String 类 提供 了 很 多 方法 ， 用 于 操作 字符 串 。 在 Java 中 ， 由 于 String 
用 得 非 负 普通，Java 对 它 有 一 些 特殊 的 处 理 ， 本 下 暂 不 介绍 这 些 内 容 ， 
只 是 把 它 当 作 一 个 表示 字符 串 的 类 型 来 看 待 。 


Date 也 是 Java API 中 的 一 个 类 ， 表 示 日 期 和 时 间 ， 它 内 部 是 一 个 
long 类 型 的 值 ， 也 提供 了 知 干 方法 用 于 操作 日 期 和 时 间 。 


用 无 参 的 构造 方法 新 建 一 个 Date 对 象 ， 这 个 对 象 就 表示 当前 时 


间 


Date now = new Date(); 


日 期 和 时 间 处 理 是 一 个 比较 大 的 话题 ， 我 们 留待 第 7 章 详解 ， 本 节 
我 们 只 是 把 它 当 作 表示 日 期 和 时 间 的 类 型 来 看 待 。 


3.2.2 ”图 形 类 


我 们 先 扩展 一 下 Point 类 ， 在 其 中 增加 一 个 方法 ， 计 算 到 男 一 个 所 
的 距离 ， 代 码 如 下 : 


public double distance(Point 
return Math.sqrt(Math.pow(x-p.getX(), 2)+Math.pow(y-p.getY(), 2)); 
} 


在 类 Point 中 ， 属 性 x、y 都 古 基 本 类 型 ,但 类 的 属性 也 可 以 是 类 。 
我 们 考虑 一 个 表示 线 的 类 ， 它 由 两 个 点 组 成 ， 有 一 个 实例 方法 计算 线 
的 长 度 ， 如 代码 清单 3-2 所 示 。 


代码 清单 3-2 ”表示 线 的 类 Line 


public class Line { 
private Point start; 
private Point end; 
public Line(Point start, Point end){ 
this.start= Start ， 
this.end = end,; 


} 
public double length(){ 
return start.distance(end); 
} 
} 


Line 由 两 个 Point 组 成 ， 在 创建 Line 时 这 两 个 Point 是 必需 的 ， 所 以 
只 有 一 个 构造 方法 ， 且 需 传递 这 两 个 点 ，length 方 法 计算 线 的 长 度 ， 它 
调用 了 Point 计 算 距 离 的 方法 获取 线 的 长 度 。 可 以 看 出 ， 在 设计 线 时 ， 
我 们 考虑 的 层次 是 点 ， 而 个 考虑 扣 的 内 部 细 卫 。 每 个 类 封装 其 内 部 细 
节 ， 对 外 提供 高 层次 的 功能 ， 使 其 他 类 在 更 高 层次 上 考虑 和 人 解决 问 
题 ， 是 程序 设计 的 一 种 基本 思维 方式 。 


使 用 这 个 类 的 代码 如 下 所 示 : 


public static void main(String[] args) { 
Point start = new Point(2,3); 
Point end = new Point(3,4); 
Line line = new Line(start, end); 
System.out.printin(line.length()); 


} 


这 也 很 位 单 。 我 们 再 说 明 一 下 内 存 布局 ，line 的 两 个 实例 成 员 痢 是 
引用 类 型 ， 引 用 实际 的 point， 整 体内 存 布局 如 图 3-1 所 示 。 


栈 


Ox1000 


start | Ox8000 0x1000 UO 2 
Ox1008 end.x 
end | Ox8008 0x1008 0x1000 endy 
line | 0x8010 Ox1010 0x1010 0x1000 “| line.start 
0x1014 0x1008 line.end 


图 3-1 图形 类 Point 和 Line 对 象 的 内 存 布局 


start、end、jline 三 个 引用 型 变量 分 配 在 栈 中 ， 保 存 的 是 实际 内 容 的 
地 址 ， 实 际 内 容 保 存在 堆 中 ，line 的 两 个 实例 变量 line.start 和 line.end 趟 
是 3 引用， 同样 保存 的 是 实际 内 容 的 地 址 。 


3.2.3 ”用 类 描述 电 商 概念 
接 下 来 ， 我 们 用 类 来 描述 一 下 电 商 系统 中 的 一 些 基 本 概念 ， 电 商 
系统 中 最 基本 的 有 产品 、 用 户 和 订单 。 
1) 产品 ， 有 产品 唯一 id、 和 名称、 描述、 图片、 价格 等 属性 。 
2) 用 户 : 有 用 户 和 名、 密码 等 属性 。 


3) 订单 : 有 订单 号 、 下 单 用 户 、 选 购 产 品 列 表 及 数量 、 下 单 时 
间 、 收 货 人 、 收 货 地 址 、 联 系 电话 、 订 单 状态 等 属性 。 


当然 ， 实 际 情况 可 能 非常 复 灯 ， 这 是 一 个 非 营 简化 的 换 述 。 


产品 类 Product 如 代码 清单 3-3 所 示 。 
代码 清单 3-3 ”表示 产品 的 类 Product 


public class Product { 
// 唯 一 id 
private String id,; 
// 产 品名 称 
private String name; 
// 产 品 图 片 链 接 
private String pictureUrl; 
// 产 品 描述 
private String description; 
// 产 品 价格 
private double price,; 


我 们 省 略 了 类 的 构造 方法 ， 以 及 属性 的 gettersetter 方 法 ， 下 面 大 部 
分 示例 代码 也 都 会 省 略 。 


这 是 用 户 类 User 的 代码 : 


public class User { 
private String name; 
private String password; 


} 


一 个 订单 可 能 会 有 多 个 产品 ， 每 个 产品 可 能 有 不 同 的 数量 ， 我 们 
目 OrderItem 这 个 类 来 摘 述 单个 产品 及 选 购 的 数量 ， 如 代码 清 
3-4/ 并 不 。 


代码 清单 3-4 ”表示 订单 条 目的 类 OrderItem 


public class OrderItem { 
// 购 买 产 品 
private Product product,; 
// 购 买 数量 
private int quantity; 
public orderItem(Product product, int quantity) { 
this,product = product,; 
this.quantity = quantity; 


} 
public double computePrice(){ 
return product.getPrice()*quantity; 


OrderItem 引 用 了 产品 类 Product， 我 们 定义 了 一 个 构造 方法 ， 以 及 
计算 该 订单 条 目 价 格 的 方法 。 


订单 类 Order 如 代码 清单 3-5 所 示 。 
代码 清单 3-5 “表示 订单 的 类 Order 


public class Order { 
// 订 单 号 
private String id; 
// 购 买 用 户 
private User USser 
// 购 买 产品 列表 及 数量 
private OrderItem[] items; 
// 下 单 时 间 
private Date createtime,; 
// 收 货 人 
private String receiver,; 
// 收 货 地 址 
private String address,; 
// 联 系 电话 
private String phone,; 
// 订 单 状态 
private String status; 
public double computeTotalPrice(){ 

double totalPrice = 0; 
if(items!=null)t{ 
for(orderItem item : Items){ 
totalprice+=item.computePrice( ); 


} 


return totalPprice; 


} 
} 


Order 类 引用 了 用 户 类 User， 以 及 一 个 订单 条 目的 数组 OrderItem ， 
它 定义 了 一 个 计算 总 价 的 方法 。 这 里 用 一 个 String 类 表示 状态 status， 更 
合适 的 应 该 是 枚 举 类 型 ， 枚 举 我 们 第 5 章 再 介绍 。 


以 上 类 定义 是 非常 简化 的 ， 但 是 大 致 演示 了 将 现实 概念 映射 为 类 
以 及 类 组 合 的 过 程 ， 这 个 过 程 大 概 就 是 ， 想 想 现实 问题 有 哪些 概念 ， 
这 些 概念 有 哪些 属性 、 哪 些 行为 ， 概 念 之 间 有 什么 关系 ， 然 后 定义 
类 、 定 义 属性 、 定 义 方法 、 定 义 类 之 间 的 关系 。 概 念 的 属性 和 行为 可 
,0 但 定义 的 类 只 需要 包括 那些 与 现实 问题 相关 的 就 行 


3.2.4 用 类 描述 人 之 间 的 血缘 关系 


上 面 介 绍 的 图 形 类 和 电 商 类 只 会 引用 别 的 类 ， 但 一 个 类 定义 中 还 
可 以 引用 它 自 己 ， 比如 我 们 要 描述 人 以 及 人 之 间 的 血缘 关系 。 我 们 用 
类 Person 表 示 一 个 人 ， 它 的 实例 成 员 包 括 其 父亲 、 母 亲 、 和 和 孩子， 这 些 
成 员 也 都 是 Person 类 型 ， 如 代码 清单 3-6 所 示 。 


代码 清单 3-6 ”表示 人 的 类 Person 


public class Person { 
// 姓 名 


private String name; 

// 父 亲 

private Person father,; 

// 母 亲 

private Person mother; 

// 孩 子 数组 

private Person[] children; 

public Person(String name) { 
this.name = name; 

} 


} 


这 里 同样 省 略 了 settergetter 方 法 。 对 初学 者 ， 初 看 起 来 这 是 比较 难 
以 理解 的 ， 有 点 类 似 于 函数 调用 中 的 递归 调用 ， 这 里 面 的 关键 点 是 ， 
实例 变量 不 需要 一 开始 就 有 值 。 我 们 来 看 下 如 何 使 用 : 


public static void main(String[] args){ 

Person laoma = new Person(" 老 马 "); 

Person xiaoma = new Person(" 小 马 ") 

xiaoma. setFather (laoma); 

laoma.setchildren(new Person[]{xiaoma}); 
System.out.printlin(xiaoma.getFather().getName()); 


这 上 段 代码 先 创建 了 老 马 (laoma) ， 然 后 创建 了 小 马 (xiaoma) ， 
接着 调用 xiaoma4 的 ]set- Faiher 广 六 和 laoina 的 SatGliildhan 方 ? 人 于 
关系 ，Person 类 对 象 的 内 存 布局 如 图 3-2 所 示 。 


堆 


图 3-2 ”Person 类 对 和 象 的 内 存 布 局 
3.2.5 ”目录 和 文件 


栈 


Xlaoma.nama 


Xiaoma Xlaoma.father 


xiaoma.mother 
laoma 


xiaoma.children 


laoma.name 
laoma.father 
laoma.mother 


laoma.children 


接 下 来 ， 我 们 介绍 两 个 类 MyFile 和 MyFolder， 分 别 表示 文件 管理 
中 的 两 个 概念 : 文件 和 文件 来。 文件 和 文件 夹 都 有 和 名称、 创建 时 间 、 
父 文件 夹 ， 根 文件 夹 没有 父 文件 夹 ， 文 件 夹 还 有 子 文件 列表 和 子 文件 
夹 列表 。 文 件 类 MyFile 如 代码 清单 3-7 所 示 。 


代码 清单 3-7 文件 类 MyFile 


public class MyFile { 
// 文 件 名 称 
private String name; 
// 创 建 时 间 
private Date createtime,; 
// 文 件 大 小 
private int size,; 
// 上 级 目录 
private MyFolder parent ; 
// 其 他 方法 …. 
public int getSize() { 

return SIze， 


} 


文件 夹 类 MyFolder 如 代码 清单 3-8 所 示 。 
代码 清单 3-8 文件 夹 类 MyFolder 


public class MyFolder { 
/ 文件 夹 名 尔 
private String name; 
// 创 建 时 间 
private Date createtime,; 
// 上 级 文件 夹 
private MyFolder parent ; 
// 包 含 的 文件 
private 直人 as files,; 
// 包 含 的 子 文件 3 
private MyFolder[] subFolders,; 
public int totalSize(){ 
int totalSize = 0; 
Ifl(files!=nu]11){ 
for(MyFile file : files){ 
totalSsize+=file.getSize(); 


} 
} 
if(subFolders!=null){ 


for(MyFolder folder : subFolders){ 
totalSsize+=folder.totalSize(); 
} 


return totalSize; 


MyFile 和 MyFolder 都 省 略 了 构造 方法 、setttergetter 方 法 ， 以 及 关 
于 父子 关系 维护 的 代码 ， 主 要 演示 实例 变量 间 的 组 合 关 系 。 两 个 类 之 
间 可 以 互相 引用 ，MyFile 引 用 了 MyFolder， 而 MyFolder 也 引用 了 
MyFile， 这 是 没有 问题 的 。 因 为 正如 之 前 所 说 ， 这 些 属性 不 需要 一 开 
始 就 设置 ， 也 不 是 必须 设置 的 。 男 外 ， 演 示 了 一 个 递归 方法 totalSize 
a R00 
很 好 的 场景 。 


3.2.6 一 些 说 明 


类 中 应 该 定义 哪些 变量 和 方法 ， 这 是 与 要 解决 的 问题 密切 相关 
的 ， 本 市 中 并 没有 特别 强调 问题 是 什么 ， 定 义 的 属性 和 方法 主要 用 于 
演示 基本 概念 ， 实 际 应 用 中 应 该 根据 具体 问题 进行 调整 。 


类 中 实例 变量 的 类 型 可 以 是 当前 定义 的 类 型 ， 两 个 类 之 间 可 以 互 
相 引 用 ， 这 些 初 听 起 来 可 能 难以 理解 ， 但 现实 世界 就 是 这 样 的 ， 创 建 
> 候 这 些 值 不 需要 一 开始 就 有 ， 也 可 以 没有 ， 所 以 是 没有 问题 


类 之 间 的 组 合 关 系 在 Java 中 实现 的 都 是 引用 ， 但 在 逻辑 天 系 上 ， 有 
两 种 明显 不 同 的 关系 ， 一 种 是 包含 ， 另 一 种 是 单纯 引用 。 比 如 ， 在 订 
单 类 Order 中 ，Order 与 User 的 关系 就 是 单纯 引用 ，User 是 独立 存在 的 ; 
而 Order 与 OrderItem 的 关系 就 是 包含 ，OrderItem 忌 是 从 属于 某 一 个 
Order ° 


3.27 加 和 


对 初学 编程 的 人 来 说 ， 不 清楚 如 何 用 程序 概念 表示 现实 问题 ， 本 
0 0 
分 解 现实 问题 中 涉及 的 概念 以 及 概念 间 的 关系 ， 将 概念 表示 为 多 
个 类 ， 通 过 类 之 间 的 组 合 来 表达 更 为 复杂 的 概念 以 及 概念 间 的 关系 ， 
征 计算 机 程序 的 一 种 基本 思维 方式 。 
正 所 谓 ， 道 生 一 ， 一 生 二 ， 二 生 三 ， 三 生 万 物 ， 如 果 将 二 进 制 表 


示 和 运算 看 作 一 ， 将 基本 数据 类 型 看 作 二 ， 基 本 数据 类 型 形成 的 类 看 
作 三 ， 那 么 ， 类 的 组 合 以 及 下 章 介 绍 的 继承 则 使 得 三 生 万 物 。 


3.3 ”代码 的 组 织 机 制 


使 用 任何 语言 进行 编程 都 有 一 个 类 似 的 问题 ， 那 就 是 如 何 组 织 代 
码 。 具 体 来 说 ， 如 何 避 人 免 命 名 冲突 ? 如 何 合理 组 织 各 种 源 文件 ?如何 
使 用 第 三 方 库 ? 各 种 代码 和 依赖 库 如 何 编 译 链接 为 一 个 完整 的 程序 ? 
本 节 殊 来 讨论 Java 中 的 解决 机 制 ， 具 体 包括 包 、jar 包 、 程 序 的 编译 与 


链接 等 。 


3.3.1 包 的 概念 


使 用 任何 语言 进行 编程 都 有 一 个 相同 的 问题 ， 束 是 命名 冲突 。 程 
序 一 般 不 全 是 一 个 人 写 的 ， 会 调用 系统 提供 的 代码 、 第 三 方 库 中 的 代 
码 、 项 目 中 其 他 人 写 的 代码 等 ， 不 同 的 人 束 不 同 的 目的 可 能 定义 同样 
的 类 名 /接口 名 ，Java 中 解决 这 个 问题 的 主要 方法 驶 是 包 。 


即使 代码 都 是 一 个 人 写 的 ， 将 多 个 关系 不 太 大 的 类 和 接口 都 放 在 
一 起 ， 也 不 便于 理解 和 维护 ，Java 中 组 织 类 和 接口 的 方式 也 是 包 。 


包 是 一 个 比较 容易 理解 的 概念 ， 类 似 于 计算 机 中 的 文件 来， 正如 
我 们 在 计算 机 中 管理 文件 ， 文 件 放 在 文件 夹 中 一 样 ， 类 和 接口 放 在 包 
中 ， 为 便于 组 织 ， 文 件 夹 一 般 是 一 个 层次 结构 ， 包 也 类 似 。 


包 有 包 名 ， 这 个 名 称 以 点 号 (.) 分 隔 表 示 层 次 结构 。 比 如 ， 我 们 
之 前 常用 的 String 类 就 位 于 包 java.lang 下 ， 其 中 java 是 上 层 包 名 ，lang 是 
下 层 包 名 。 带 完整 包 名 的 类 名 称 为 其 完全 限定 名 ， 比如 String 类 的 完 
全 限定 名 为 java.lang.String。Java API 中 所 有 的 类 和 接口 都 位 于 包 Java 
或 javax 下 ，Java 是 标准 包 ，javax 是 扩展 包 。 


接 下 来 ， 我 们 讨论 包 的 细节 ， 包 括 包 的 声明 、 使 用 和 包 范 围 可 见 


1. 声 明 类 所 在 的 包 


我 们 之 前 定义 类 的 时 候 没 有 定义 其 所 在 的 包 ， 黑 认 情 况 下 ， 类 位 
于 默认 包 下 ， 使 用 默认 包 是 不 建议 的 ， 我 们 使 用 默认 包 只 十 简 单 起 


见 。 


定义 类 的 时 候 ， 应 该 先 使 用 关键 字 package 声 明 其 包 名 ， 如 下 所 
和 个 : 

package shuo.1laoma; 

public class Hello 区 


} 


以 上 声明 类 Hello 的 包 名 为 shuo.laoma， 包 声明 语句 应 该 位 于 源 代 
码 的 最 前 面 ， 前 面 不 能 有 注释 外 的 其 他 语句 。 


包 和 名 和 文件 目录 结构 必须 匹配 ， 如 果 源 文件 的 根 目 录 为 E: \src\， 
则 上 面 的 Hello 类 对 应 的 文件 Hello.java， 其 全 路 径 就 应 该 是 E: 
\src\shuo\laoma\Hello.java。 如果 不 匹 瑟 ，Java 会 提示 编译 错误 。 


为 避免 命名 冲突 ，Java 中 命名 包 名 的 一 个 惯例 是 使 用 域名 作为 前 
级 ， 因 为 域名 是 唯一 的 ， 一 般 按 照 域名 的 反 序 来 定义 包 名 ， 比 如 ， 域 
名 是 apache.org， 包 名 束 以 org.apache 开 头 。 


没有 域名 的 也 没关系 ， 使 用 一 个 其 他 代码 不 太 会 用 的 包 名 即 可 ， 
比如 本 节 使 用 的 shuo.laoma。 如果 代 码 需 要 公开 给 其 他 人 用 ， 最 好 有 
一 个 域名 以 确保 唯一 性 ， 如 果 只 是 内 部 使 用 ， 则 确保 内 部 没有 其 他 代 
码 使 用 该 包 名 即 可 。 


除了 避免 命名 冲突 ， 包 也 是 一 种 方便 组 织 代码 的 机 制 。 一 般 而 
言 ， 同 一 个 项 目下 的 所 有 代码 都 有 一 个 相同 的 包 前 组 ， 这 个 前 绥 是 唯 
一 的 ， 不 会 与 其 他 代码 重 名 ， 在 项 目 内 部 ， 根 据 不 同 目的 再 细 分 为 子 
包 ， 子 包 可 能 又 会 分 为 下 一 级 子 包 ， 形 成 层次 结构 ， 内 部 实现 一 般 位 
于 比较 底层 的 包 。 

包 可 以 方便 模块 化 开发 ， 不 同 功能 可 以 位 于 不 同 包 内 ， 不 同 开发 
人 员 人 负责 不 同 的 包 。 包 也 可 以 方便 封装 ， 供 外 部 使 用 的 类 可 以 放 在 包 
的 上 层 ， 而 内 部 的 实现 细节 则 可 以 放 在 比较 底层 的 子 包 内 。 


2. 通 过 包 使 用 类 


同一 个 包 下 的 类 之 间 互 相 引 用 是 不 需要 包 名 的 ， 可 以 直接 使 用 。 
但 如 末 类 不 在 同一 个 包 内 ， 则 必须 要 知道 其 所 在 的 包 。 使 用 有 两 种 方 
式 : 一 种 是 通过 类 的 完全 限定 名 ; 男 外 一 种 是 将 用 到 的 类 引入 当前 
类 。 只 有 一 个 例外 ，java.lang 包 下 的 类 可 以 直接 使 用 ， 不 需要 引入 ， 
和 比如 String 类 、System 类 ， 其 他 包 内 的 类 则 
NT 


en. 子 ， 使 用 Arrays 类 中 的 sort 方 法 ， 通 过 完全 限定 名 可 以 这 样 


int[] arr = new int[]{1,4,2,3}; 
java.util.Arrays.sort(arr); 
System.out.println(java.util.Arrays.tostring(arr)); 


显然 ， 这 样 比较 烦琐 ， 另 外 一 种 驶 是 将 该 类 引入 当前 类 。 引 入 的 
import 需 要 放 在 package 定 义 之 后 ， 类 定义 之 前 ， 如 
下 所 示 : 


package shuo.1laoma,; 
import java.util.Arrays,; 
public class Hello { 
public static void main(String[] args) { 
int[] arr = new int[]{1,4,2,3}; 
Arrays.sort(arr); 
System.out.println(Arrays.toString(arr)); 
} 
} 


做 import 操 作 时 ， 可 以 一 次 将 某 个 包 下 的 所 有 类 引入 ， 语 法 是 使 
用 .*， 比 如 ， 将 java.util 包 下 的 所 有 类 3 引入， 语法 是 : import 
java.util.*。 需 要 注意 的 是 ， 这 个 引入 不 能 递归 ， 它 只 会 引入 java.util 包 
下 的 直接 类 ， 而 不 会 引入 java.util 下 上 般 套 包 内 的 类 ， 比 如 ， 不 会 引入 包 
javautil.zip 下 面 的 类 。 试 图 舱 套 引入 的 形式 也 是 无 效 的 ， 如 import 


java.util.*.* o 
在 一 个 类 内 ， 对 其 他 类 的 引用 必须 是 唯一 确定 的 ， 不 能 有 重 名 的 


类 ， 如 果 有 ， 则 通过 import 只 能 引入 其 中 的 一 个 类 ， 其 他 同名 的 类 则 
必须 要 使 用 完全 限定 名 。 


引入 类 是 一 个 比较 烦琐 的 工作 ， 不 过 ， 大 多 数 Java 开 发 环境 都 提 
供 工 具 目 动 做 这 件 事 。 比 如 ， 在 Eclipse 中 ， 通 过 执行 Source -> Organize 
Imports 命 令 或 按 对 应 的 快捷 键 Ctrl+Shift+O 就 可 以 自动 管理 引用 的 类 。 


有 一 种 特殊 类 型 的 导入 ， 称 为 静态 导入 ， 它 有 一 个 static 天 键 字 ， 
可 以 直接 导入 类 的 公开 静态 方法 和 成 员 。 看 个 例子 : 


import static java.lang.System.out; // 导 入 静态 变量 out 
public class Hello { 
public static void main(String[] args) { 
int[] arr = new int[]{1,4,2,3}; 
sort(arr); // 可 以 直接 使 用 Arrays 中 的 sort 方 法 
out .println(Arrays.toString(arr)); // 可 以 直接 使 用 out 变 量 


QH 


} 
} 


静态 导入 不 应 过 度 使 用 ， 否 则 难以 区 分 访问 的 是 哪个 类 的 代码 。 
3. 包 范围 可 见 性 


前 面 章 世 我 们 介绍 过 ， 对 于 类 、 变 量 和 方法 ， 都 可 以 有 一 个 可 见 
性 修饰 从 public/private， 我 们 还 提 到 ， 可 以 不 写 修饰 符 。 如 果 什 么 修 
饰 符 都 不 写 ， 它 的 可 见 性 范围 就 是 同一 个 包 内 ， 同 一 个 包 内 的 其 他 类 
可 以 访问 ， 而 其 他 包 内 的 类 则 不 可 以 访问 。 


需要 说 明 的 是 ， 同 一 个 包 指 的 是 同一 个 直接 包 ， 子 包 下 的 类 并 不 
能 访问 。 比 如 ， 类 shuo.laoma.Hello 和 shuo.laoma.innerTest， 其 所 在 的 
包 shuo.laoma 和 shuo.laoma.inner 是 两 个 完全 独立 的 包 ， 并 没有 逻辑 上 的 
联系 ，Hello 类 和 Test 类 不 能 互相 访问 对 方 的 包 可 见 性 方法 和 属性 。 


除了 public 和 private 修 贤 符 ， 还 有 一 个 与 继承 有 关 的 修饰 符 
protected。 关 于 protected 的 细 市 我 们 下 章 介 绍 ， 这 里 需要 说 明 的 是 ， 
protected 可 见 性 包括 包 可 见 性 ， 也 就 是 说 ， 声 明 为 protected 不 仪表 明 
子 类 可 以 访问 ， 还 表明 同一 个 包 内 的 其 他 类 可 以 访问 ， 即 使 这 些 类 不 
是 子 类 也 可 以 。 


总 结 来 说 ， 可 见 性 范围 从 小 到 大 是 :private< 默 认 ( 包 ) 


<protected<public 。 


3.3.2 jar 包 


为 方便 使 用 第 三 方 代码 ， 也 为 了 方便 我 们 写 的 代码 给 其 他 人 使 
用 ， 各 种 程序 语言 大 多 有 打包 的 概念 ， 打 包 的 一 般 不 是 源 代码 ， 而 是 
he ° 打包 将 多 个 编译 后 的 文件 打包 为 一 个 文件 ， 方 便 其 他 
予 吉 用 。 


在 Java 中 ， 编 译 后 的 一 个 或 多 个 包 的 Java class 文 件 可 以 打包 为 一 
0 Java 中 打包 命令 为 jar， 打 包 后 的 文件 扩展 名 为 jar， 一 般 称 之 
Jjar 包 ° 


可 以 使 用 如 下 方式 打包 ， 首 先 到 编译 后 的 java class 文 件 根 目录 ， 
然后 运行 如 下 命令 : 


jar -cvf < 包 名 >.jar < 最 上 层 包 名 > 


比如 ， 对 前 面 介绍 的 类 打包 ， 如 果 Hello.class 位 于 E: 
\bin\shuo\laoma\Hello.class， 则 可 以 到 目录 E: \bin 下 ， 然 后 运行 : 


jar -cvf hello.jar shuo 


hello.jar 束 是 jar 包 ，jar 包 其 实 就 是 一 个 压缩 文件 ， 可 以 使 用 解压 缩 
工具 打开 。 


Java 类 库 、 第 三 方 类 库 都 是 以 jar 包 形式 提供 的 。 如 何 使 用 jar 包 
(classpath) 中 即 可 。 类 路 径 是 什么 呢 ? 我 们 下 


3.3.3 程序 的 编译 与 链接 


从 Java 源 代码 到 运行 的 程序 ， 有 编译 和 链接 两 个 步 又。 编译 是 将 
源 代码 文件 变 成 扩展 名 是 .class 的 一 种 字 节 码 ， 这 个 工作 一 般 是 由 javac 
命令 完成 的 。 链 接 是 在 运行 时 动态 执行 的 ，.class 文 件 不 能 直接 运行 ， 
运行 的 是 Java 虚 拟 机 ， 虚 拟 机 听 起 来 比较 抽象 ， 执 行 的 就 是 Java 命 


令 ， 这 个 命令 解析 .class 文 件 ， 转 换 为 机 器 能 识别 的 二 进 制 代码 ， 然 后 
运行 。 所 请 链接 束 是 根据 引用 到 的 类 加 载 相 应 的 字 节 码 并 执行 。 


Java 编 译 和 运行 时 ， 都 需要 以 参数 指定 一 个 classpath， 即 类 路 径 。 
类 路 径 可 以 有 多 个 ， 对 于 直接 的 class 文 件 ， 路 径 是 class 文 件 的 根 目 
录 ; 对 于 jar 包 ， 路 径 是 jar 包 的 完整 名 称 (包括 路 径 和 jar 包 名 ) 。 在 
Windows 系 统 中 ， 多 个 路 径 用 分 号 “; "分隔 ; 在 其 他 系统 中 ， 以 冒 
号 “; ”分 隔 。 

在 Java 源 代码 编译 时 ，Java 编 译 器 会 确定 引用 的 每 个 类 的 完全 限 
定名 ， 确 定 的 方式 是 根据 import 语 句 和 classpath。 如 果 导 入 的 是 完全 限 
定 类 名 ， 则 可 以 直接 比较 并 确定 。 如 果 是 模糊 导入 (import 带 .*) ， 则 
根据 classpath 找 对 应 父 包 ， 再 在 父 包 下 寻找 是 否 有 对 应 的 类 。 如 果 多 
个 模糊 导入 的 包 下 都 有 同样 的 类 名 ， 则 Java 会 提示 编译 错误 ， 此 时 应 
该 明确 指定 导入 哪个 类 。 


Java 运 行 时 ， 会 根据 类 的 完全 限定 名 寻找 并 加 载 类 ， 寻 找 的 方式 
就 是 在 类 路 径 中 寻找 ， 如 果 是 class 文 件 的 根 目 录 ， 则 直接 查看 是 否 有 
对 应 的 子 目录 及 文件 ， 如 果 有 是 jar 文 件 ， 则 首先 在 内 存 中 解压 文件 ， 然 
后 再 查看 是 否 有 对 应 的 类 。 


总 结 来 说 ，import 古 编译 时 概念 ， 用 于 确定 完全 限定 名 ， 在 运行 
时 ， 只 根据 完全 限定 名 寻找 并 加 载 类 ， 编译 和 运行 时 都 依赖 类 路 径 ， 
类 路 径 中 的 jar 文 件 会 被 解压 缩 用 于 寻找 和 加 载 类 。 


3 Wj 和 续 


本 节 介 绍 了 Java 中 代码 组 织 的 机 制 、 包 和 jar 包 ， 以 及 程序 的 编译 
和 链接 。 将 类 和 接口 放 在 合适 的 具有 层次 结构 的 包 内 ， 避 免 命名 圳 
突 ， 代 码 可 以 更 为 清晰 ， 便 于 实现 封装 和 模块 化 开发 ; 通过 jar 包 使 用 
第 三 方 代码 ， 将 自身 代码 打包 为 jar 包 供 其 他 程序 使 用 。 这 些 都 是 解决 
复杂 问题 所 必需 的 。 


在 Java 9 中 ， 清 晰 地 引入 了 模块 的 概念 ，JDK 和 JRE 都 按 模块 化 进 
行 了 重 构 ， 传 统 的 组 织 机 制 依然 征文 持 的 ， 但 新 的 应 用 可 以 使 用 模 
块 。 一 个 应 用 可 由 多 个 模块 组 成 ， 一 个 模块 可 由 多 个 包 组 成 。 模 块 之 
间 可 以 有 一 定 的 依赖 关系 ， 一 个 模块 可 以 导出 包 给 其 他 模块 用 ， 可 以 


提供 服务 给 其 他 模块 用 ， 也 可 以 使 用 其 他 模块 提供 的 包 ， 调 用 其 他 模 
块 提供 的 服务 。 对 于 复 淋 的 应 用 ， 模 块 化 有 很 多 好 处 ， 比 如 更 强 的 封 
法 、 更 为 可 靠 的 配置 、 更 为 松散 的 糊 合 、 更 动态 灵活 等 。 模 块 是 一 个 
很 大 的 主题 ， 限 于 篇 幅 ， 我 们 束 不 详细 介绍 了 。 


至 此 ， 关 于 类 的 基础 知识 吏 介 绍 完了 。 类 之 间 除 了 组 合 关系 ， 还 
有 一 种 非常 重要 的 关系 ， 那 就 古 继 承 ， 我 们 下 幕 来 探讨 。 


第 4 章 ” 类 的 继承 


上 一 章 ， 我 们 谈 到 了 如 何 将 现实 中 的 概念 映射 为 程序 中 的 概念 ， 
我 们 谈 了 类 以 及 类 之 间 的 组 合 ， 现 实 中 的 概念 间 还 有 一 种 非常 重要 的 
关系 ， 殊 是 分 类 。 分 类 有 个 根 ， 然 后 同 下 不 断 细 化 ， 形 成 一 个 层次 分 
类 体系 ， 这 种 例子 古 非 常 多 的 。 


1) 在 自然 世界 中 ， 生 物 有 动物 和 植物 ， 动 物 有 不 同 的 科目 ， 食 肉 
动物 、 食 草 动物 、 杂 食 动物 等 ， 食 肉 动物 有 狼 、 豹 、 虎 等 ， 这 些 又 细 
分 为 不 同 的 种 类 。 


2) 打开 电 商 网 站 ， 在 显著 位 置 一 般 都 有 分 类 列表 ， 比 如 家 用 电 
磺 、 服 装 ， 服 装 有 女装 、 男 装 ， 男 装 有 衬衫 、 牛 仔 钴 等 。 


计算 机 程序 经 常 使 用 类 之 间 的 继承 关系 来 表示 对 象 之 间 的 分 类 关 
系 。 在 继承 关系 中 ， 有 父 类 和 了 于 类 ， 比 如 动物 类 Animal 和 狗 类 Dog， 
Animal 是 父 类 ，Dog 是 子 类 。 父 类 也 叫 基 类 ， 子 类 也 叫 派生 类 。 父 
类 、 子 类 是 相对 的 ， 一 个 类 B 可 能 是 类 A 的 子 类 ， 但 又 古 类 C 的 父 类 。 


之 所 以 叫 继承 ， 是 因为 子 类 继承 了 父 类 的 属性 和 行为 ， 父 类 有 的 
属性 和 行为 子 类 都 有 。 但 子 类 可 以 增加 子 类 特有 的 属性 和 行为 ， 某 些 
父 类 有 的 行为 ， 子 类 的 实现 方式 可 能 与 父 类 也 不 完全 一 样 。 


使 用 继承 一 方面 可 以 复 用 代码 ， 公 共 的 属性 和 行为 可 以 放 到 父 类 
中 ， 而 子 类 只 需要 关注 子 类 特有 的 就 可 以 了 ; 男 一 方面 ， 不 同 子 类 的 
对 和 象 可 以 更 为 方便 地 被 统一 处 理 。 


本 章 评 细 介 绍 继承 。 我 们 先 介绍 继承 的 基本 概念 ， 然 后 详 述 继承 
的 一 些 细 世 ， 理 解 了 继承 的 用 法 之 后 ， 我 们 探讨 继承 实现 的 基本 原 
理 ， 最 后 讨论 继承 的 注意 事项 ， 解 释 为 什么 说 继承 征 把 双 刃 剑 ， 以 及 
如 何 正 确 地 使 用 继承 。 


4.1 基本 概念 


本 市 介绍 Java 中 继承 的 基本 概念 ， 在 Java 中 ， 所 有 类 都 有 一 个 父 
类 Object， 我 们 先 来 看 这 个 类 ， 然 后 主要 通过 图 形 处 理 中 的 一 些 人 简单 
例子 来 介绍 继承 的 基本 概念 。 


4.1.1 根 父 类 Object 


在 Java 中 ， 即 使 没有 声明 父 类 ， 也 有 一 个 隐 含 的 父 类 ， 这 个 父 类 
HHObject。Object 没 有 定义 属性 ， 但 定义 了 一 些 方法 ， 如 图 4-1 所 示 。 


equals(Object obj) : boolean - Object 
getClass() : Class<?> - Object 
hashCode() : int - Object 

notify() : void - Object 

notifyAll() : void - Object 


toString() : String - Object 
wait() : void - Object 
wait(long timeout) : void - Object 
© wait(long timeout, int nanos) : void - Object 


图 4-1 类 Object 中 的 方法 


本 节 我 们 会 介绍 toString () 方法 ， 其 他 方法 我 们 会 在 后 续 章 节 中 
逐步 介绍 。toString () 方法 的 目的 是 返回 一 个 对 象 的 文本 描述 ， 这 个 


方法 可 以 直接 被 所 有 类 使 用 。 
比如 ， 对 于 我 们 上 一 章 介 绍 的 Point 类 ， 可 以 这 样 使 用 toString 方 
1 


Point p = new Point(2,3) 
System,.out ,println(p.toString() )， 


输出 类 似 这 样 : 


Point@76f9aa66 


这 是 什么 意思 呢 ?@ 之 前 是 类 名 ，@ 之 后 的 内 容 是 什么 呢 ? 我 们 
来 看 下 toString () 方法 的 代码 : 


public String toString() { 
return getClass().getName() + "@" + Integer.toHexString(hashCode()); 
} 


getClass () .getName () 返回 当前 对 象 的 类 名 ，hashCode () 返 
回 一 个 对 象 的 哈 硕 值 ， 哈 硕 我 们 会 在 后 续 章 和 进一步 介绍 ， 这 里 可 以 
理解 为 是 一 个 整数 ， 这 个 整数 默认 情况 下 ， 通 党 是 对 象 的 内 存 地 址 
值 ，Integer.toHexString (hashCode () ) 返回 这 个 哈 希 值 的 十 六 进 制 
表示 。 


为 什么 要 这 么 写 呢 ? 写 类 名 是 可 以 理解 的 ， 表 示 对 象 的 类 型 ， 而 
写 哈 硕 值 则 是 不 得 已 的 ， 因 为 Object 类 并 不 知道 具体 对 象 的 属性 ， 不 
en 

但 子 类 是 知道 目 己 的 属性 的 ， 子 类 可 以 重 写 父 类 的 方法 ， 以 反映 
0 
下 o 


412 方 潜 重 写 


上 一 章 ， 我 们 介绍 了 一 些 图 形 处 理 类 ， 其 中 有 Point 类 ， 这 次 我 们 
重 写 其 toString () 方法 ， 如 代码 清单 4-1 所 示 。 


代码 清单 4-1 Point 类 : 重 写 toString () 方法 


public class Point { 
private int x; 
private int y; 
public Point(int x, int y) { 
this.x = x; 
this.y = y; 


} 
public double distance(Point point){ 
return Math.sqrt(Math.pow(this.x-point.getX( ),2) 
+Math.pow(this.y-point.getY(), 2)); 


} 
public int getX() { 
return x; 


} 
public int getY() { 
return y; 


Q@Override 
public String toString() { 
return ("+x+", "+y+" )"; 


toString () 方法 前 面 有 一 个 @Override， 这 表示 toString () 这 个 
方法 是 重 写 的 父 类 的 方法 ， 重 写 后 的 方法 返回 Point 的 x 和 y 坐 标的 值 。 
SE 
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Point p = new Point(2,3); 
System.out.println(p.toString()); 


4.1.3 ”图 形 类 继承 体系 


接 下 来 ， 我 们 以 一 些 图形 处 理 中 的 例子 来 进一步 解释 。 和 来 看 一 
些 图 形 的 例子 ， 如 图 4-2 所 示 。 


这 都 是 一 些 基本 的 图 形 ， 图 形 有 线 、 正 方形 、 三 角形 、 圆 形 等 ， 
0 。 接 下 来 ， 我 们 定义 以 下 类 来 说 明 关 于 继承 的 一 些 


-CAA 
OO mee 
A Ah 
什 令 罗 人 人才 
辆 合 太 国会 广 


图 4-2 一 些 图 形 的 例子 
. 父 类 Shape， 表 示 图 形 。 
.类 Circle， 表 示 圆 。 
.类 Line， 表 示 直 线 。 
:类 ArrowLine， 表 示 带 箭头 的 直线 。 
1. 图 形 


所 有 图 形 (Shape) 都 有 一 个 表示 颜色 的 属性 ， 有 一 个 表示 绘制 的 
方法 ， 如 代码 清单 4-2 所 示 。 


代码 清单 4-2 ”类 Shape 


public class Shape { 
private static final String DEFAULT_COLOR = "black"; 
private String color,; 
public Shape() { 
this(DEFAULT_COLOR); 


} 
public Shape(String color) { 
this.color = color; 


} 
public String getColor() { 
return color,; 


} 
public void setColor(String color) { 
this,.color = color; 


} 
public void draw(){ 
System,out,printJln("draw shape"); 


以 上 代码 非常 简单 ， 实 例 变 量 color 表 示 颜 色 ，draw 方 法 表示 绘 
制 ， 我 们 没有 写实 际 的 绘制 代码 ， 主 要 是 演示 继承 关系 。 


一 


2. 贡 


(Circle) 继承 自 Shape， 但 包括 了 额外 的 属性 ， 中心 点 和 半 
径 ， 以 及 额外 的 方法 area， 用 于 计算 面积 ， 另 外 ， 重 写 了 draw 方 法 ， 
如 代码 清单 4-3 所 示 。 


代码 清单 4-3 ”类 Circle 


public class Circle extends Shape { 

// 中 心 点 

private Point center,; 

// 半 径 

private double r; 

public Circle(Point center, double r) { 
this.center = center,; 
this.r = r; 


QOverride 
public void draw() { 
System.out.println("draw circle at " +center.toString()+" with r "+r 
+", UsSing color : "+getColor()); 


} 

public double area(){ 
return Math.PI*r*r,; 

} 


} 


说 明 : 


1) Java 使 用 extends 关 键 字 表示 继承 关系 ， 一 个 类 最 多 只 能 有 一 个 
父 类 ; 


2) 子 类 不 能 直接 访问 父 类 的 私有 属性 和 方法 。 比 如 ， 在 Circle 
中 ， 不 能 直接 访问 Shape 的 私有 实例 变量 color; 


3) 除了 私有 的 外 ， 子 类 继承 了 父 类 的 其 他 属性 和 方法 。 比 如 ， 在 
Circle 的 draw 方 法 中 ， 可 以 直接 调用 getColor () 方法 。 


使 用 它 的 代码 如 下 : 


public static void main(String[] args) { 
Point center = new Point(2,3); 
// 创 建 圆 ， 赋 值 给 circle 
Circle circle = new Circle(center,2); 
// 调 用 draw 方 法 ， 会 执行 Circle 的 draw 方 法 
circle.draw(); 
// 输 出 圆 面 积 
System.out.println(circle.area()); 


= 


程序 的 输出 为 : 


draw circle at (2,3) with r 2.0, using color : black 
12.566370614359172 


这 里 比较 奇怪 的 是 ，color 是 什么 时 候 赋 值 的 ? 在 new 的 过 程 中 ， 
父 类 的 构造 方法 也 会 执行 ， 且 会 优先 于 子 类 执行 。 在 这 个 例子 中 ， 父 
类 Shape 的 默认 构造 方法 会 在 子 类 Circle 的 构造 方法 之 前 执行 。 关 于 
new 过 程 的 细节 ， 我 们 会 在 4.3 节 进一步 介绍 。 
3. 直 线 


线 (Line) 继承 目 Shape， 但 有 两 个 点 ， 以 及 一 个 获取 长 度 的 方 
法 ， 并 重 写 了 draw 方 法 ， 如 代码 清单 4-4 所 示 。 


代码 清单 4-4 类 Line 


public class Line extends Shape { 
private Point start; 
private Point end,; 
public Line(Point start, Point end, String color) { 
super (color); 
this,.start = start,; 
this.end = end; 


} 
public double length(){ 
return start.distance(end); 


} 
public Point getStart() { 
return start; 


} 
public Point getEnd() { 
return end ， 


QOverride 
public void draw() { 
System.out.printjn("draw line from " 
+ Start.toString()+" to "+end.toString() 
+ "using color "+super.getColor()); 


这 里 我 们 要 说 明 的 是 super 这 个 关键 字 ，super 用 于 指 代 父 类 ， 可 用 
于 调用 父 类 构造 方法 ， 访 问 父 类 方法 和 变量 。 

1) 在 Line 构 造 方法 中 ，super (color) 表示 调用 父 类 的 带 color 参 
数 的 构造 方法 。 调 用 父 类 构造 方法 时 ，super 必 须 放 在 第 一 行 。 


2) 在 draw 方 法 中 ，super.getColor () 表示 调用 父 类 的 getColor 方 
法 ， 当 然 不 写 super. 也 是 可 以 的 ， 因 为 这 个 方法 子 类 没有 同名 的 ， 没 有 
歧义 ， 当 有 歧义 的 时 候 ， 通 过 super. 可 以 明确 表示 调用 父 类 的 方法 。 


3) super 同 样 可 以 引用 父 类 非 私 有 的 变量 。 

可 以 看 出 ，super 的 使 用 与 this 有 点 像 ， 但 super 和 this 是 不 同 的 ， 
this 引 用 一 个 对 象 ， 是 实 实 在 在 存在 的 ， 可 以 作为 函数 参数 ， 可 以 作为 
返回 值 ， 但 super 只 是 一 个 关键 字 ， 不 能 作为 参数 和 返回 值 ， 它 只 是 用 

告诉 编译 如 访问 父 类 的 相关 变量 和 方法 。 
4. 市 箭头 直线 


带 箭 头 直 线 (ArrowLine) 继承 自 Line， 但 多 了 两 个 属性 ， 分 别 表 
示 两 端 是 否 有 箭头 ， 也 重 写 了 draw 方 法 ， 如 代码 清单 4-5 所 示 。 


代码 清单 4-5 类 ArrowLine 


public class ArrowLine extends Line { 

private boolean startArrow; 

private boolean endArrow; 

public ArrowLine(Point start, Point end, String color, 

boolean startArrow, boolean endArrow) { 

super(start, end, color); 
this.startArrow = startArrow; 
this.endArrow = endArrow; 


QOverride 
public void draw() { 
super .draw( ); 
if(startArrow)t{ 
System.out.println("draw start arrow"); 


} 
if(endArrow)t{ 

System,out,println("draw end arrow"); 
} 


} 
} 


ArrowLine 继 承 目 Line， 而 Line 继 承 目 Shape，ArrowLine 的 对 象 也 
有 Shape 的 属性 和 方法 。 


注意 draw 〈) 方法 的 第 一 行 ，super.draw () 表示 调用 父 类 的 draw 
方法 ， 这 时 候 不 带 super. 是 不 行 的 ， 因 为 当前 的 方法 也 叫 draw 


需要 说 明 的 是 ， 这 里 ArrowLine 继 承 了 Line， 也 可 以 直接 在 类 Line 
里 加 上 属性 ， 而 不 需要 单独 设计 一 个 类 ArrowLine， 这 里 主要 是 演示 继 
了 藉 的 层级 性 。 


5. 图 形 管理 紫 

使 用 继承 的 一 个 好 处 是 可 以 统一 处 理 不 同 子 类 型 的 对 象 。 比 如 ， 
我 们 来 看 一 个 图 形 管理 者 类 ， 它 人 负责 管理 画板 上 的 所 有 图 形 对 象 并 人 负 
责 绘制 ， 在 绘制 代码 中 ， 只 需要 将 每 个 对 象 当 作 Shape 并 调用 draw 方 法 
就 可 以 了 ， 系 统 会 目 动 执行 子 类 的 draw 方 法 。 如 代码 清单 4-6 所 示 。 


代码 清单 4-6 形 管理 器 类 ShapeManager 


public class ShapeManager { 
private static final int MAX_NUM = 100; 


private Shape[] shapes = new Shape[MAX_NUM]; 
private int shapeNum = 0; 
public void addShape(Shape shape)t{ 
if(shapeNum<MAX_NUM) 
shapes[shapeNum++] = shape,; 


} 
public void draw(){ 
for(int i=0; i<shapeNum; i++){ 
shapes[i].draw( ); 


ShapeManager 使 用 一 个 数组 保存 所 有 的 shape， 在 draw 方 法 中 调用 
每 个 shape 的 draw 方 法 。ShapeManager 并 不 知道 每 个 shape 具 体 的 类 
型 ， 也 不 关心 ， 但 可 以 调用 到 子 类 的 draw 方 法 。 


我 们 来 看 下 使 用 ShapeManager 的 一 个 例子 : 


public static void main(String[] args) { 
ShapeManager manager = new ShapeManager(); 
manager .addShape(new Circle(new Point(4,4),3)); 
manager .addShape(new Line(new Point(2,3), new Point(3,4),"green")); 
manager .addShape(new ArrowLine(new Point(1,2), 
new Point(5,5),"black",false, true)); 
manager .draw( )，; 


新 建 了 三 个 shape， 分 别 是 一 个 圆 、 直 线 和 市 箭头 的 线 ， 然 后 加 到 
了 shape manager 中 ， 然 后 调用 manager 的 draw 方 法 。 


需要 说 明 的 是 ， 在 addShape 方 法 中 ， 参 数 Shape shape， 声 明 的 类 
型 是 Shape， 而 实际 的 类 型 则 分 别 是 Circle、Line 和 ArrowLine。 子 类 对 
象 赋值 给 父 类 引用 变量 ， 这 叫 向 上 转型 ， 转型 就 是 转换 类 型 ， 向 上 转 
型 就 是 转换 为 父 类 类 型 。 


变量 shape 可 以 引用 任何 Shape 子 类 类 型 的 对 象 ， 这 叫 多 态 ， 即 一 
种 类 型 的 变量 ， 可 引用 多 种 实际 类 型 对 象 。 这 样 ， 对 于 变量 shape， 它 
就 有 两 个 类 型 : 类 型 Shape， 我 们 称 之 为 shape 的 静态 类 型 ， 类 型 
Circle/Line/ArrowLine， 我 们 称 之 为 shape 的 动态 类 型 。 在 
ShapeManager 的 draw 方 法 中 ，shapes[i].draw () 调用 的 是 其 对 应 动态 
类 型 的 draw 方 法 ， 这 称 之 为 方法 的 动态 绑 定 。 


为 什么 要 有 多 态 和 动态 绑 定 呢 ? 创建 对 象 的 代码 (ShapeManager 
以 外 的 代码 ) 和 操作 对 象 的 代码 (ShapeManager 本 身 的 代码 ) ， 经 党 
不 在 一 起 ， 操 作对 象 的 代码 往往 只 知道 对 象 是 某 种 父 类 型 ， 也 往往 只 
需要 知道 它 是 某 种 父 类 型 束 可 以 了 。 


可 以 说 ， 多 态 和 动态 绑 定 是 计算 机 程序 的 一 种 重要 思维 方式 ， 使 
得 操作 对 象 的 程序 不 需要 关注 对 象 的 实际 类 型 ， 从 而 可 以 统一 处 理 不 
同 对 象 ， 但 又 能 实现 每 个 对 象 的 特有 行为 。 在 4.3 节 ， 我 们 会 进一步 介 
绍 动态 绑 定 的 实现 原理 。 


下 江 二 加 和 


本 市 介绍 了 继承 和 多 态 的 基本 概念 。 


1) 每 个 类 有 且 只 有 一 个 父 类 ， 没 有 声明 父 类 的 ， 其 父 类 为 
Object， 子 类 继承 了 父 类 非 private 的 属性 和 方法 ， 可 以 增加 自己 的 属性 
和 方法 ， 以 及 重 写 父 类 的 方法 实现 。 

2) new 过 程 中 ， 父 类 先进 行 初始 化 ， 可 通过 super 调 用 父 类 相应 的 
构造 方法 ， 没 有 使 用 super 的 情况 下 ， 调 用 父 类 的 默认 构造 方法 。 

3) 子 类 变量 和 方法 与 父 类 重 名 的 情况 下 ， 可 通过 super 强 制 访 问 
父 类 的 变量 和 方法 。 

4) 子 类 对 象 可 以 赋值 给 父 类 引用 变量 ， 这 叫 多 态 ; 实际 执行 调用 
的 是 子 类 实现 ， 这 叫 动态 绑 定 。 

继承 和 多 态 的 基本 概念 是 比较 简单 的 ， 子 类 继承 父 类 ， 目 动 拥 有 
父 类 的 属性 和 行为 ， 并 可 扩展 属性 和 行为 ， 同时， 可 重 写 父 类 的 方法 
以 修改 行为 。 但 天 于 继承 ， 还 有 很 多 细 市 ， 我 们 下 一 广 继 续 讨 论 。 


4.2 ”继承 的 细 塘 


本 市 探讨 继续 的 一 些 细节 ， 具 体 包 括 : 
.构造 方法 ; 

重 名 与 静态 绑 定 ; 

. 重 载 和 重 写 ; 

父子 类 型 转换 ; 

-继承 访问 权限 (protected) ; 
可 见 性 重 写 ; 

:防止 继承 (final) 

下 面 我 们 逐个 介 和 


4.2.1 构造 方法 


前 面 我 们 说 过 ， 子 类 可 以 通过 super 调 用 父 类 的 构造 方法 ， 如 果子 
类 没有 通过 super 调 用 ， 则 会 自动 调动 父 类 的 默认 构造 方法 ， 那 如 果 父 
类 没有 默认 构造 方法 呢 ? 如 下 所 示 : 


public class Base { 
private String member ; 
public Base(String member){ 
this.member = member,; 


这 个 类 只 有 一 个 带 参 数 的 构造 方法 ， 没 有 默认 构造 方法 。 这 个 时 
候 ， 它 的 任何 子 类 都 必须 在 构造 方法 中 通过 super 调 用 Base 的 市 参数 构 
造 方法 ， 如 下 所 示 ， 否 则 ，Java 会 提示 编译 错误 。 


public class Child extends Base { 
public Child(String member) { 
super (member ) ， 


男 外 需要 注意 的 是 ， 如 琳 在 父 类 构造 方法 中 调用 了 可 被 重 写 的 方 
SO 


public class Base { 
public Base(){ 
test(); 


} 
public void test(){ 
} 


构造 方法 调用 了 test () 方法 。 这 是 子 类 代码 : 


public class Child extends Base { 
private int a = 123 
public Child(){ 


} 
public void test(){ 
System.out.println(a); 


子 类 有 一 个 实例 变量 a， 初 始 赋值 为 123， 重 写 了 test () 方法 ， 输 
出 a 的 值 。 看 下 使 用 的 代码 : 


public static void main(String[] args)t{ 
Child c = new Child(); 
c.test(); 

} 


输出 结 采 是 : 


123 


第 一 次 输出 为 0， 第 二 次 输出 为 123。 第 一 行为 什么 是 0 呢 ? 第 一 次 
输出 是 在 new 过 程 中 输出 的 ， 在 new 过 程 中 ， 首 先是 初始 化 父 类 ， 父 类 
构造 方法 调用 test () 方法 ，test () 方法 被 子 类 重 写 了 ， 束 会 调用 子 
类 的 test () 方法 ， 子 类 方法 访问 子 类 实例 变量 89， 而 这 个 时 候 子 类 的 
实例 变量 的 赋值 语句 和 构造 方法 还 没有 执行 ， 所 以 输出 的 十 其 默认 值 
05° 


像 这 样 ， 在 父 类 构造 方法 中 调用 可 被 子 类 重 写 的 方法 ， 是 一 种 不 
好 的 实践 ， 容 易 引 起 混淆 ， 应 该 只 调用 private 的 方法 。 


4.2.2 ” 重 名 与 静态 绑 定 


4.1 节 我 们 所 到 ， 子 类 可 以 重 写 父 类 非 private 的 方法 ， 当 调用 的 时 
候 ， 会 动态 绑 定 ， 执 行 子 类 的 方法 。 那 实例 变量 、 静 态 方法 和 静 态 变 
量 呢 ? 它们 可 以 重 名 吗 ? 如 果 重 名 ， 访 问 的 是 哪 一 个 呢 ? 


重 名 是 可 以 的 ， 重 名 后 实际 上 有 两 个 变量 或 方法 。private 变 量 和 
方法 只 能 在 类 内 访问 ， 访 问 的 也 永远 是 当前 类 的 ， 即 : 在 子 类 中 访问 
的 是 子 类 的 ; 在 父 类 中 访问 的 是 父 类 的 ， 它 们 只 有 是 碰巧 名 字 一 样 而 
已 ， 没 有 任何 关系 。 


public 变 量 和 方法 ， 则 要 看 如 何 访 问 它 。 在 类 内 ， 访 问 的 是 当前 类 
的 ， 但 子 类 可 以 通过 super. 明 确 指 定 访 问 父 类 的 。 在 类 外 ， 则 要 看 访问 
变量 的 静态 类 型 : 静态 类 型 是 父 类 ， 则 访问 父 类 的 变量 和 方法 ， 静 态 
人 


public class Base { 
public static String s = "static base"; 
public String m = "base"; 
public static void staticTest(){ 
System.out.println("base static: "+s); 


定义 了 一 个 public 静 态 变 量 s， 一 个 public 实 例 变量 m， 一 个 静态 方 
法 staticTest。 这 是 子 类 代码 : 


public class Child extends Base { 
public static String s = "child_base",; 
public String m = "child"; 
public static void staticTest(){ 
System.out.println("child static: "+s); 
} 


} 


子 类 定义 了 和 父 类 重 名 的 变量 和 方法 。 对 于 一 个 子 类 对 象 ， 它 就 
有 了 两 份 变 量 和 方法 ， 在 子 类 内 部 访问 的 上 时候， 访问 的 是 子 类 的 ， 或 
0 
部 访问 的 代码 : 


public static void main(String[] args) { 
Child c = new Child(); 
Base b = c; 
System.out.println(b.s); 
System.out.println(b.m); 
b.staticTest(); 
System.out.println(c.s); 
System.out.println(c.m); 
c.staticTest(); 


以 上 代码 创建 了 一 个 子 类 对 象 ， 然 后 将 对 象 分 别 赋 值 给 了 子 类 引 
用 变量 c 和 父 类 引用 变量 b， 然 后 通过 b 和 c 分 别 引 用 变量 和 方法 。 这 里 
需要 说 明 的 是 ， 静 仿 变 量 和 静态 方法 一 般 通 过 类 名 直接 访问 ， 但 也 可 
以 通过 类 的 对 象 访问 。 程 序 输出 为 : 


static_base 

base 

base static: static base 
child_base 

child 

child static: child base 


当 通 过 b (静态 类 型 Base) 访问 时 ， 访 问 的 是 Base 的 变量 和 方法 ， 
当 通 过 c (静态 类 型 Child) 访问 时 ， 访 问 的 是 Child 的 变量 和 方法 ， 这 
称 之 为 静态 绑 定 ， 即 访问 绑 定 到 变量 的 静态 类 型 。 静 仿 绑 定 在 程序 纺 
译 阶 段 即 可 决定 ， 而 动态 绑 定 则 要 等 到 程序 运行 时 。 实 例 变量 、 静 态 
变量 、 静 态 方法 、private 方 法 ， 都 是 静态 绑 定 的 。 


4.2.3 重 载 和 重 写 


重 载 是 指 方法 名 称 相同 但 参数 签名 不 同 (参数 个 数 、 类 型 或 顺序 
不 同 ) ， 重 写 是 指 子 类 重 写 与 父 类 相同 参数 签名 的 方法 。 对 一 个 函数 
调用 而 言 ， 可 能 有 多 个 匹配 的 方法 ， 有 时 候选 择 哪 一 个 并 不 是 那么 明 
显 。 我 们 来 看 个 例子 ， 这 是 基 类 代 碍 : 


public class Base { 
public int sum(int a, int b){ 
System.out.println("base_int_int"); 
return a+b 
} 
} 


它 定 义 了 方法 sum， 下 面 是 子 类 代码 : 


public class Child extends Base { 
public long sum(long a, long b){ 
System.out.println("child_long_long"); 
return a+b 
} 
} 


以 下 是 调用 的 代码 : 


public static void main(String[] args)t{ 
Child c = new Child(); 


int a = 2; 
int b = 3,; 
c.sum(a, b); 


} 


Child 和 Base 都 定义 了 sum 方 法 ， 这 里 调用 的 是 哪个 sum 方 法 呢 ? 子 
类 的 sum 方 法 参数 类 型 虽然 不 完全 匹配 但 是 是 兼容 的 ， 父 类 的 sum 方 法 
参数 类 型 是 完全 匹配 的 。 程 序 输 出 为 : 


base_int_int 


父 类 类 型 完全 匹配 的 方法 被 调用 了 。 如 果 父 类 代码 改 成 下 面 这 样 
呢 ? 


public class Base { 
public long sum(int a, long b){ 
System,.out.printlin("base_int_long"); 
return a+b 
} 
} 


父 类 方法 类 型 也 不 完全 匹配 了 。 程 序 输 出 为 : 


base_int_long 


调用 的 还 是 父 类 的 方法 。 父 类 和 子 类 的 两 个 方法 的 类 型 都 不 完全 
匹配 ， 为 什么 调用 父 类 的 呢 ? 因为 父 类 的 更 匹配 一 些 。 现 在 修改 一 下 
子 类 代码 ， 更 改 为 : 


public class Child extends Base { 
public long sum(int a, long b){ 
System,out,println("child_int_ long"); 
return a+b 
} 
} 


程序 输出 变 为 了 : 


child_ int_long 


终于 调用 了 子 类 的 方法 。 可 以 看 出 ， 当 有 多 个 重 名 函数 的 时 候 ， 
在 决定 要 调用 哪个 函数 的 过 程 中 ， 首 先是 按照 参数 类 型 进行 匹配 的 ， 
换 名 话说， 寻找 在 所 有 重 载 版 本 中 最 匹配 的 ， 然 后 才 看 变量 的 动态 类 
型 ， 进 行动 态 绑 定 。 


4.2.4 ”父子 类 型 转换 


之 前 我 们 说 过 ， 子 类 型 的 对 象 可 以 赋值 给 父 类 型 的 引用 变量 ， 这 
叫 问 上 转型 ， 那 父 类 型 的 变量 可 以 赋值 给 子 类 型 的 变量 吗 ? 或 者 说 可 
以 同 下 转型 吗 ? 语法 上 可 以 进行 强制 类 型 转换 ， 但 不 一 定 能 转换 成 
功 。 我 们 以 前 面 的 例子 来 看 : 


Base b = new Child()， 
Child c = (Child)b， 


Child c= (Child) b 就 是 将 变量 b 的 类 型 强制 转换 为 Child 并 赋值 为 
C， 问题 的 ， 因 为 b 的 动态 类 型 就 是 Child， 但 下 面 的 代码 是 不 
行 的 : 


Base b = new Base(); 
Child c = (Child)b， 


语法 上 Java 不 会 报错 ， 但 运行 时 会 抛 出 错误 ， 错 误 为 类 型 转换 异 
常 。 


一 个 父 类 的 变量 能 不 能 转换 为 一 个 子 类 的 变量 ， 取 决 于 这 个 父 类 
0 ( 即 引 用 的 对 象 类 型 ) 是 不 是 这 个 子 类 或 这 个 子 类 的 


给 定 一 个 父 类 的 变量 能 不 能 知道 它 到 底 是 不 是 某 个 子 类 的 对 象 ， 
从 而 安全 地 进行 类 型 转换 昵 ? 答案 是 可 以 ， 通 过 instanceof 关键 字 ， 看 
下 面 代 码 : 


public boolean canCast(Base b){ 
return b instanceof Child; 
} 


这 个 函数 返回 Base 类 型 变量 是 否 可 以 转换 为 Child 类 型 instanceof 
剖面 十 变 量 ， 后 面 是 类 ， 返 回 值 是 boolean 值 ， 表 示 变 量 引用 的 对 象 是 
不 是 该 类 或 其 子 类 的 对 象 。 


4.2.5 继承 访问 权限 protected 


变量 和 函数 有 public/private 修 饰 从 ，public 表 示 外 部 可 以 访问 ， 
private 表 示 只 能 内 部 使 用 ， 还 有 一 种 可 见 性 介 于 中 间 的 修饰 符 
protected， 表 示 虽 然 不 能 被 外 部 任意 访问 ， 但 可 被 子 类 访问 。 另 外 ， 
protected 还 表示 可 被 同一 个 包 中 的 其 他 类 访问 ， 不 管 其 他 类 是 不 是 该 
类 的 子 类 。 我 们 来 看 个 例子 ， 这 是 基 类 代码 : 


public class Base { 
protected int currentStep ， 
protected void stepi1(){ 


} 
protected void step2(){ 


public void action(){ 
this,currentStep = 1; 
step1(); 
this,currentStep = 2,; 
step2(); 


action 表 示 对 外 提供 的 行为 ， 内 部 有 两 个 步骤 step1 () 和 step2 
JW ， 使 用 currentStep 变 量 表 示 当 前 进行 到 了 哪个 步骤 ，step1 () 、 
step2 () 和 currentStep 是 protected 的 ， 子 类 一 般 不 重 写 action， 而 只 重 
写 step1 和 step2， 同 时 ， 子 类 可 以 直接 访问 currentStep 查 看 进行 到 了 哪 
一 步 。 子 类 的 代码 是 : 


public class Child extends Base { 
protected void stepi1(){ 
System.out,println("child step " + this.currentStep); 


protected void step2(){ 
System,.out,println("child step " + this.currentStep); 


使 用 Child 的 代码 是 : 


public static void main(String[] args)t{ 
Child c = new Child(); 
c.action(); 


输出 为 : 


child step 1 
child step 2 


基 类 定义 了 表示 对 外 行为 的 方法 action， 并 定义 了 可 以 被 子 类 重 写 
的 两 个 步骤 step1 () 和 step2 () ， 以 及 被 子 类 查看 的 变量 


currentStep ， 子 类 通过 重 写 protected 方 法 step1 () 和 step2 () 来 修改 
对 外 的 行为 。 


这 种 思路 和 设计 是 一 种 设计 模式 ， 称 之 为 模板 方法 。action 方 法 
就 是 一 个 模板 方法 ， 它 定义 了 实现 的 模板 ， 而 具体 实现 则 由 子 类 提 
供 J 法 在 很 多 框架 中 有 广泛 的 应 用 ， 这 是 使 用 protected 的 一 种 
常见 场景 。 


4.2.6 ”可 见 性 重 写 


重 写 方法 时 ， 一 般 并 不 会 修改 方法 的 可 见 性 。 但 我 们 还 是 要 说 明 
一 点 ， 重 写 时 ， 子 类 方法 不 能 降低 父 类 方法 的 可 见 性 。 不 能 降低 是 
指 ， 父 类 如 果 是 public， 则 子 类 也 必须 是 public， 父 类 如 果 是 
protected， 子 类 可 以 是 protected， 也 可 以 是 public， 即 子 类 可 以 升级 父 
类 方法 的 可 见 性 但 不 能 降低 。 看 个 例子 ， 基 类 代码 为 : 


public class Base { 
protected void protect(){ 


} 
public void open(){ 
} 


子 类 代码 为 : 


public class Child extends Base { 
// 以 下 是 不 允许 的 ， 会 有 编译 错误 
//private void protect(){ 


// 以 下 是 不 允许 的 ， 会 有 编译 错误 


public void protect(){ 


为 什么 要 这 样 规定 呢 ? 继承 反映 的 是 “is-a" 的 关系 ， 即 子 类 对 象 也 
属于 父 类 ， 子 类 必须 支持 父 类 所 有 对 外 的 行为 ， 将 可 见 性 降低 就 会 减 
少子 类 对 外 的 行为 ， 从 而 破坏 “is-a” 的 关系 ， 但 子 类 可 以 增加 父 类 的 行 
为 ， 所 以 提升 可 见 性 是 没有 问题 的 。 


4.2.7 ”防止 继承 final 


4.3 广 我 们 会 提 到 ， 继 承 是 把 双 丸 全， 融 来 的 影响 就 是 ， 有 的 时 候 
我 们 不 希望 父 类 方法 被 子 类 重 写 ， 有 的 时 候 甚 至 不 希望 类 被 继承 ， 可 
以 通过 final 关 键 字 实现 。final 关 键 字 可 以 修饰 变量 ， 而 这 是 final 的 男 一 
种 用 法 。 一 个 Java 类 ， 默 认 情 况 下 都 是 可 以 被 继承 的 ， 但 加 了 final 关 
键 字 之 后 就 不 能 被 继承 了 ， 如 下 所 示 : 


public final class Base { 
// 主 体 代码 


} 


一 个 非 final 的 类 ， 其 中 的 public/protected 实 例 方法 默认 情况 下 都 是 
可 以 被 重 写 的 ， 但 加 了 final 关 键 字 后 整 不 能 被 重 写 了 ， 如 下 所 示 : 


public class Base { 
public final void test(){ 
System.out.println(" 不 能 被 重 写 " ) ; 


至 此 ， 天 于 Java 继 和 承 概念 一 些 细 广 就 介绍 完了 。 但 还 有 些 重 要 的 
地 方 我 们 没有 讨论 ， 比 如 ， 创 建 子 类 对 象 的 具体 过 程 ? 动态 绑 定 是 如 
何 实现 的 ? 让 我 们 下 市 来 探讨 继承 实现 的 基本 原理 。 


4.3 ”继承 实现 的 基本 原理 


侍卫 通过 和 个 例 于 洒 介 绍 继承 实现 的 基本 原理 。 需 要 说 明 的 是 ， 
本 证 主 要 从 概念 上 来 介绍 绍 原 理 ， 实际 实现 细 市 可 能 与 此 不 同 。 


4.3.1 示例 


基 类 Base 如 代码 清单 4-7 所 示 。 
代码 清单 4-7 演示 继承 原理 : Base 类 


public class Base { 
public static int s; 
private int a; 


static { 
System.out.println(" 基 类 静态 代码 块 ，s: "+s); 
$ =; 

} 

{ 


System.out.println(" 基 类 实例 代码 块 ，a: "+a); 
a 


} 

public Base(){ 
System.out.println(" 基 类 构造 方法 ，a; "+a); 
a. =: 2 


} 
protected void step(){ 
System.out.printin("base S: "+ S +", a: "+a); 


public void action(){ 
System.out.printlin("start"); 


step(); 
System.out.println("end"); 


} 
} 


Base 包 括 一 个 静态 变量 s， 一 个 实例 变量 a， 一 段 静 态 初始 化 代码 
块 ， 一 段 实例 初始 化 代码 块 ， 一 个 构造 方法 ， 两 个 方法 step 和 action 。 
子 类 Child 如 代码 清单 4-8 所 示 。 


代码 清单 4-8 演示 继承 原理 : Child 类 


public class Child extends Base { 
public static int s; 


private int a; 


static { 
System.out.println(" 子 类 静态 代码 块 ，s: "+s); 
s = 10; 

} 

{ 


System.out.println(" 子 类 实例 代码 块 ，a: "+a); 
a = 10; 


} 

public Child( ){ 
System.out.println(" 子 类 构造 方法 ，a: "+a); 
a = 20; 


protected void step(){ 
System.out,.println("child s: "+ Ss +", a: "+a); 


Child 继 承 了 Base， 也 定义 了 和 基 类 同名 的 静态 变量 s 和 实例 变量 
静态 初始 化 代码 块 ， 实 例 初 始 化 代码 块 ， 构 造 方法 ， 重 写 了 方法 
使 用 的 例子 如 代码 清单 4-9 所 示 。 


代码 清单 4-9 ”演示 继承 原理 : main 方 法 


public static void main(String[] args) { 


System.out.printin("---- new Child()"); 
Child c = new Child(); 
System.out.printin("\n---- c.action()"); 


c.action(); 
Base b = c; 


System.out.printlin("\n---- b.action()"); 
b.action(); 

System.out.printin("\n---- b.s: "+ b.s); 
System.out.printin("\n---- Cc.S: "+ C.S); 


上 面 的 代码 创建 了 Child 类 型 的 对 象 ， 赋 值 给 了 Child 类 型 的 引用 变 
量 c， 通 过 c 调 用 action 方 法 ， 又 赋值 给 了 Base 类 型 的 引用 变量 b， 通 过 b 
也 调用 了 action， 最 后 通过 b 和 c 访 问 静 态 变 量 s 并 输出 。 汉 症 屏 舌 的 输出 


= 
后 


---- new Child() 
基 类 静态 代码 块 ，s: 

子 类 静态 代码 块 ，s: 
基 类 实例 代码 块 ，a: 
基 类 构造 方法 ， 2 
子 类 实例 代码 块 ，a: 0 
子 类 构造 方法 ，a: 10 


- Cc.action() 


Start 
child s: 10, a: 20 
end 


-- b.action() 
start 
child s: 10, a: 20 
end 


-- b.s: 1 


-- Cc.s: 10 


下 面 我 们 来 解释 一 下 背后 都 发 生 了 一 些 什么 事情 ， 从 类 的 加 载 开 


口 


4.3.2 ”类 加 载 过 程 


在 Java 中 ， 所 请 类 的 加 载 古 指 将 类 的 相关 信息 加 载 到 内 存 。 在 Java 
中 ， 类 是 动态 加 载 的 ， 当 第 一 次 使 用 这 个 类 的 时 候 才 会 加 载 ， 加 载 一 
个 类 时 ， 会 查看 其 父 类 是 否 已 加 载 ， 如 末 没 有 ， 则 会 加 载 其 父 类 。 

1) 一 个 类 的 信息 主要 包括 以 下 部 分 : 

-类 变量 (静态 变量 ) ，; 

-类 初始 化 代码 ; 

-类 方法 (静态 方法 ) ， 

实例 变量 ; 

实例 初始 化 代码 ; 

:实例 方法 ; 

父 类 信息 引用 。 

2) 类 初始 化 代码 包括 : 

:定义 静态 变量 时 的 赋值 语句 |; 


.静态 初始 化 代码 块 。 

3) 实例 初始 化 代码 包括 : 

.定义 实例 变量 时 的 赋值 语句 ; 

实例 初始 化 代码 块 ; 

-构造 方法 。 

4) 类 加 载 过 程 包 括 : 

.分配 内 存 保存 类 的 信息 ; 

.给 类 变量 赋 默 认 值 ; 

.加 载 父 类 ; 

:设置 父子 关系; 

.执行 类 初始 化 代码 。 

注意 ， 类 初始 化 代码 ， 是 先 执行 父 类 的 ， 再 执行 子 类 的 。 不 过 ， 
父 类 执行 时 ， 子 类 静态 变量 的 值 也 是 有 的 ， 是 默认 值 。 对 于 默认 值 ， 
我 们 之 前 说 过 ， 数 字 型 变量 都 是 0，boolean 是 false，char 是 \u0000'， 引 
用 型 变量 是 nul。 

之 前 我 们 说 过 ， 内 存 分 为 栈 和 堆 ， 栈 存放 范 数 的 局 部 变量 ， 而 堆 
存放 动态 分 配 的 对 象 ， 还 有 一 个 内 存 区 ， 存 放 类 的 信息 ， 这 个 区 在 Java 
中 称 为 方法 区 。 

加 载 后 ，Java 方 法 区 就 有 了 一 份 这 个 类 的 信息 。 以 我 们 的 例子 来 


说 ， 有 3 份 类 信息 ,分别 是 Child、Base、Object， 内 存 布局 如 图 4-3 所 
不 。 


pg Object 
4 public String toString() | 


/ toString 方 法 地 址 return getClass().getName() + '@' + 


| IntegertoHexString(hashCode()); 
| .… 其 他 方法 地 址 ) 
\ 
\ System.out.printin(" 基 类 静态 代码 块 , s; "+S); 
we \ Base EE 
a \ 父 类 System.out.println(" 基 类 实例 代码 块 , a: "+a); 
RX a= 1; 
/ 静态 变量 1(static int s) 
A System.out.println(" 基 类 构造 方法 , a; "+a); 
| 实例 变量 定义 private int a a=2; 
类 初 始 化 代码 class_init() protected void step(j[ 
\ a System.out.printin("base S: " + Ss +", ai "+a); 
\ 实例 初始 化 代码 instance_init() | ) 
实例 方法 step() public void action(){ 
System.out.println("start ); 
action() 一 step() 
System.out.println("end ); 
] 
& 本 System.out.println(" 子 类 静态 代码 块 , s: "+s); 
AR s= 10; 
、 父 类 
静态 变量 10(static int s) Rosetnaee 区 天 全 各 六 a: "+a); 
a= 10; 
sr a. VY 
实例 变量 定义 te 
用 System.out.printIn(" 子 类 构造 方法 , a: "+a); 
类 初始 化 代码 class_init() 2 
实例 初 始 化 代码 instance_init() pieced void step(){ ” 
ystem.out.printin("child s: " + S +", ai +a); 


图 4-3 ”继承 原理 : 类 信息 内 存 布局 


我 们 用 class_init () 来 表示 类 初始 化 代码 ， 用 instance_init () 表 

示 实 例 初 始 化 代码 ， 实 例 初 始 化 代码 包括 了 实例 初始 化 代码 块 和 构造 

° 例子 中 只 有 一 个 构造 方法 ， 实 际 情况 则 可 能 有 多 个 实例 初始 化 
J 


本 例 中 ， 类 的 加 载 大 人 致 就 是 在 内 存 中 形成 了 类 似 上 面 的 布局 ， 然 


后 分 别 执行 了 Base 和 Child 的 类 初始 化 代码 。 接 下 来 ， 我 们 看 对 象 创建 
的 过 程 。 


4.3.3 “对象 创建 的 过 程 


本 new Child () 就 是 创建 Child 对 象 ， 创 建 对 象 过 程 
已 J 各 : 


1) 分 配 内 存 ; 

2) 对 所 有 实例 变量 赋 默 认 值 ; 

3) 执行 实例 初始 化 代码 。 

分 配 的 内 存 包 括 本 类 和 所 有 父 类 的 实例 变量 ， 但 不 包括 任何 静态 
变量 。 实 例 初始 化 代码 的 执行 从 父 类 开始 ， 再 执行 子 类 的 。 但 在 任何 
类 执行 初始 化 代码 之 前 ， 所 有 实例 变量 都 已 设置 完 默 认 值 。 

每 个 对 象 除 了 保存 类 的 实例 变量 之 外 ， 还 保存 看 实际 类 信息 的 引 


O 


Child c=new Child () ; 会 将 新 创建 的 Child 对 象 引 用 赋 给 变量 c， 
Le 会 让 b 也 引用 这 个 Child 对 象 。 创 建 和 赋值 后 ， 内 存 布局 如 
4-4 所 示 。 


截 


2 


栈 


0x8008 0x1000 


内 
0x1000 


Child <c 


Baseb 


方法 区 
Child 
| 
10Gstatic int s) 


图 4-4 ”继承 原理 ， 对象 内 存 布局 


引用 型 变量 c 和 b 分 配 在 栈 中 ， 它 们 指向 相同 的 堆 中 的 Child 对 象 。 
Child 对 象 存储 着 方法 区 中 Child 类 型 的 地 址 ， 还 有 Base 中 的 实例 变量 a 和 
Child 中 的 实例 变量 a。 创 建 了 对 象 ， 接 下 来 ， 来 看 方法 调用 的 过 程 。 


4.3.4 ”方法 调用 的 过 程 


我 们 先 来 看 c.action () ; ， 这 句 代码 的 执行 过 程 : 

1) 查看 c 的 对 象 类 型 ， 找 到 Child 类 型 ， 在 Child 类 型 中 找 action 方 
法 ， 发 现 没 有 ， 到 父 类 中 寻找 ; 

2) 在 父 类 Base 中 找到 了 方法 action， 开 始 执行 action 方 法 ; 


3) action 先 输出 了 start， 然 后 发 现 需 要 调用 step () 方法 ， 就 从 
Child 类 型 开始 寻找 step () 方法 ; 


4) 在 Child 类 型 中 找到 了 step () 方法 ， 执 行 Child 中 的 step () 方 
法 ， 执 行 完 后 返回 action 方 法 ; 


5) 继续 执行 action 方 法 ， 输 出 end 。 


寻找 要 执行 的 实例 方法 的 时 候 ， 是 从 对 象 的 实际 类 型 信息 开始 碍 
找 的 ， 找 不 到 的 时 候 ， 再 碍 找 父 类 类 型 信息 。 


我 们 来 看 b.action () ， 这 句 代 码 的 输出 和 c.action () 是 一 样 的 ， 
这 称 为 动态 绑 定 ， 而 动态 绑 定 实现 的 机 制 束 是 根据 对 象 的 实际 类 型 查 
找 要 执行 的 方法 ， 子 类 型 中 找 不 到 的 时 候 再 查找 父 类 。 这 里 ， 因 为 b 和 
c 指 向 相同 的 对 象 ， 所 以 执行 结果 是 一 样 的 。 


如 琳 继 承 的 层次 比较 深 ， 要 调用 的 方法 位 于 比较 上 层 的 父 类 ， 则 
调用 的 效率 是 比较 低 的 ， 因 为 每 次 调用 都 要 进行 很 多 次 查找 。 大 多 数 
系统 使 用 一 种 称 为 虚 方 法 表 的 方法 来 优化 调用 的 效率 。 


所 谓 虚 方法 表 ， 就 是 在 类 加 载 的 时 候 为 每 个 类 创建 一 个 表 ， 记 录 
该 类 的 对 象 所 有 动态 绑 定 的 方法 (包括 父 类 的 方法 ) 及 其 地 址 ， 但 一 


个 方法 只 有 一 条 记录 ， 子 类 重 写 了 父 类 方法 后 只 会 保留 子 类 的 。 对 于 
本 例 来 说 ，Child 和 Base 的 虚 方 法 表 如 图 4-5 所 示 。 


| Object | 
| toString | 


Base 虚 方法 表 
protected void step(){ 


step() ——— System.out.println("base s: "+ Ss +", a: "+a); 
} 


action 
toString DB 
-i 有 public void action(){ 


System.out.printin("start’); 


public String toString() | p(); es 
return getClass().getName() + '@" + System.,out.printinCend); 

Integer.toHexString(hashCode()); } 

} 


Child 虚 方法 表 
action 
protected void step(){ 
step() | 一 人 人。 System.out.printin('child s: "+ s +", a; "+a); 
- | } 
| toString | 


图 4-5 ”继承 原理 ， 虚 方法 表 


对 Child 类 型 来 说 ，action 方 法 指 上 加 Base 中 的 代码 ，toString 方 法 指 问 
Object 中 的 代码 ， 而 step () 指向 本 类 中 的 代码 。 当 通过 对 象 动态 绑 定 
方法 的 时 候 ， 只 需要 查找 这 个 表 束 可 以 了 ， 而 不 需要 挨个 查找 每 个 父 
类 。 接 下 来 ， 我 们 介绍 变量 访问 的 过 程 。 


4.3.5 ”变量 访问 的 过 程 


对 变量 的 访问 是 静态 绑 定 的 ， 无 论 是 夫 变 量 还 是 实 人 jj 变量 。 代 码 
中 演示 的 是 类 变量 : b.s 和 c.s， 通 过 对 象 访问 类 变量 ， 系 统 会 转换 为 直 
接 访 问 类 变量 Base.s 和 Child.s。 


例子 中 的 实例 变量 都 是 private 的 ， 不 能 直接 访问 ;如果 是 public 
的 ， 则 b.a 访 问 的 是 对 象 中 Base 类 定义 的 实例 变量 8a， 而 c.a 访 问 的 是 对 象 
中 Child 类 定义 的 实例 变量 a。 


3 


本 下 通 过 一 个 例子 来 介绍 类 的 加 载 、 对 象 创建 、 方 法 调用 以 及 变 
量 访问 的 内 部 过 程 。 现 在 ， 我 们 应 该 对 继承 的 实现 有 了 比较 清楚 的 理 
解 。 之 前 我 们 提 人 到， 继承 是 把 双 为 证， 为 什么 这 么 说 呢 ? 让 我 们 下 市 


来 探讨 。 


4.4 为 什么 说 继承 是 把 双 刃 剑 


继承 其 实 是 把 双 刃 记 : 一 方面 继承 是 非常 强大 的 ; 另 一 方面 继承 
的 破坏 力也 是 很 强 的 。 


继承 广泛 应 用 于 各 种 Java API、 框架 和 类 库 之 中 ， 一 方面 它们 内 
部 大 量 使 用 继承 ， 另 一 方面 它们 设计 了 良好 的 框架 结构 ， 提 供 了 大 量 
基 类 和 基础 公共 代码 。 使 用 者 可 以 使 用 继承 ， 重 写 适 当 方法 进行 定 
制 ， 就 可 以 简单 方便 地 实现 强大 的 功能 。 


但 ， 继 承 为 什么 会 有 破坏 力 呢 ?主要 是 因为 继承 可 能 破坏 封装 ， 
而 封闭 可 以 说 是 程序 设计 的 第 一 原则 ; 另外 ， 继 承 可 能 没有 反映 出 is- 
a 关系 。 下 面 我 们 详细 来 说 明 。 


4.4.1 继承 破坏 封装 


什么 是 封装 呢 ? 封装 就 是 隐藏 实现 细节 ， 提 供 简 化 接口 。 使 用 者 
只 需要 关注 怎么 用 ， 而 不 需要 关注 内 部 古 怎 么 实现 的 。 实 现 细 市 可 以 
随时 修改 ， 而 不 影 啊 使 用 者 。 函 数 是 封装 ， 类 也 十 封 闻 。 通 过 封 逆 ， 
才能 在 更 高 的 层次 上 考虑 和 解决 问题 。 可 以 说 ， 封 痛 是 程序 设计 的 第 
一 原则 ， 没 有 封装 ， 代 码 之 间 会 到 处 存在 着 实现 细 世 的 依赖 ， 则 构建 
和 维护 复杂 的 程序 是 难以 想象 的 。 


继承 可 能 破坏 封装 是 因为 子 类 和 父 类 之 间 可 能 存在 着 实现 细节 的 
依赖 。 子 类 在 继承 父 类 的 时 候 ， 往 往 不 得 不 关注 父 类 的 实现 细节 ， 而 
父 类 在 修改 其 内 部 实现 的 时 候 ， 如 果 不 考虑 子 类 ， 也 往往 会 影响 到 子 
ee 
略 其 实际 意义 。 


4.4.2 封 竣 是 如 何 被 破坏 的 


我 们 来 看 一 个 简单 的 例子 ， 基 类 Base 如 代码 清单 4-10 所 示 。 
代码 清单 4-10 ”继承 破坏 封装 : 基 类 Base 


public class Base { 
private static final int MAX_NUM = 1000; 
private int[] arr = new int[MAX_NUM]; 
private int count 
public void add(int number){ 
if(count<MAX_NUM)E 
arr[count++] = number; 
} 


} 
public void addAll(int[] numbers){ 
for(int num : numbers){ 
add (num); 


Base 提 供 了 两 个 方法 add 和 addAll， 将 输入 数字 添加 到 内 部 数组 
中 。 对 使 用 者 来 说 ，add 和 addAll 束 是 能 够 添加 数字 ， 具 体 是 怎么 添加 
的 ,不 用 关心 。 

子 类 代码 Child 如 代码 清单 4-11 所 示 。 


代码 清单 4-11 ”继承 破坏 封装 ， 子 类 Child 


public class Child extends Base { 
private long sum; 
QOverride 
public void add(int number) { 
super.add(number ) ， 
Sum+=number ， 


Qoverride 
public void addAll(int[] numbers) { 
super .addAll(numbers); 
for(int i=0;i<numbers.length;i++){ 
sum+=numbers[i]; 
} 


} 
public long getSum() { 
return sum; 


子 类 重 写 了 基 类 的 add 和 addAll 方 法 ， 在 添加 数字 的 同时 汇 忌 数 
字 ， 存 储 数 字 的 和 到 实例 变量 sum 中 ， 并 提供 了 方法 getSum 获 取 sum 的 
值 。 使 用 Child 的 代码 如 下 所 示 : 


public static void main(String[] args) { 
Child c = new Child(); 
c.addAll(new int[]{1,2,3}); 
System.out.println(c.getSum()); 


使 用 addAlH 添 加 1、2、3， 期 望 的 输出 是 1+t2+3=6， 实 际 输出 为 
121 为 什么 是 12 呢 ?查看 代码 不 难看 出 ， 同 一 个 数字 被 汇总 了 两 次 。 
子 类 的 addAll 方 法 首先 调用 了 父 类 的 add-All 方 法 ， 而 父 类 的 addAll 方 法 
通过 add 方 法 添加 ， 由 于 动态 绑 定 ， 子 类 的 add 方 法 会 执行 ， 子 类 的 add 
也 会 做 汇总 操作 。 


可 以 看 出 ， 如 采 子 类 不 知道 基 类 方法 的 实现 细 广 ， 它 束 不 能 正确 
I 展 。 知道 了 错误 ， 现 在 我 们 修改 子 类 实现 ， 修 改 addAll 方 法 


Q@override 
public void addAll(int[] numbers) { 
super .addAll(numbers); 


也 就 是 说 ，addAll 方 法 不 再 进行 重复 汇总 。 这 次 ， 程 序 就 可 以 输 
出 正确 结果 6 了 。 


但 是 ， 基 类 Base 决 定 修改 addAll 方 法 的 实现 ， 改 为 下 面 代码 : 


public void addAll(int[] numbers)t{ 
for(int num : numbers)t{ 
if(count<MAX_NUM)E 
arr[count++] = num， 
} 


} 
} 


也 束 是 说 ， 它 不 再 通过 调用 add 方 法 添加 ， 这 是 Base 类 的 实现 细 
节 。 但 是 ， 修 改 了 其 类 的 内 部 细节 后 ， 上 面 使 用 子 类 的 程序 却 错 了 ， 
输出 由 正确 值 6 变 为 了 0。 


从 这 个 例子 ， 可 以 看 出 ， 子 类 和 父 类 之 间 是 细 广 依赖， 子 类 扩展 
父 类 ， 仪 仅 知 道 父 类 能 做 什么 是 不 够 的 ， 还 需要 知道 父 类 是 怎么 做 
的 ， 而 父 类 的 实现 细 市 也 不 能 随意 修改 ， 否 则 可 能 影响 子 类 。 


更 具体 地 说 ， 子 类 需要 知道 父 类 的 可 重 写 方法 之 间 的 依赖 天 系 ， 
具体 到 上 例 中 ， 就 是 add 和 addAll 方 法 之 间 的 关系 ， 而 且 这 个 依赖 天 
系 ， 父 类 不 能 随意 改变 。 


但 即使 这 个 依赖 关系 不 变 ， 封 洲 还 是 可 能 被 破坏 。 还 是 上 面 的 例 
子 ， 我 们 先 将 addAll 方 法 改 回 去 ， 这 次 ， 我 们 在 基 类 Base 中 添加 一 个 
方法 clear， 这 个 方法 的 作用 是 将 所 有 添加 的 数 子 清空， 代码 如 下 : 


public void clear(){ 
for(int i=0;i<count;i++){ 
arr[i]=0; 


count = 0; 


} 


基 类 添加 一 个 方法 不 需要 告诉 子 类 ，Child 类 不 知道 Base 类 添加 了 
这 么 一 个 方法 ， 但 因为 继承 关系 ，Child 类 却 自动 拥有 了 这 么 一 个 方 
法 。 因 此 ，Child 类 的 使 用 者 可 能 会 这 么 使 用 Child 类 : 


public static void main(String[] args) { 
Child c = new Child(); 
c.addAll(new int[]{1,2,3}); 
c.clear(); 
c.addAll(new int[]{1,2,3}); 
System,.out.println(c.getSum()); 


先 添加 一 次 ， 之 后 调用 clear 消 空 ， 义 添加 一 次 ， 最 后 输出 sum， 
期 望 结果 是 6， 但 实际 输出 是 12。 因 为 Child 没 有 重 写 cdlear 方 法 ， 它 需 
要 增加 如 下 代码 ， 重 置 其 内 部 的 sum 值 : 


Q@Override 

public void clear() { 
super.clear(); 
this.sum = 0，; 


} 


可 以 看 出 ， 父 类 不 能 随意 增加 公开 方法 ， 因 为 给 父 类 增加 就 是 给 
子 类 增加 ， 而 子 类 可 能 必须 要 重 写 该 方法 才能 确 你 方法 的 正确 


总 结 一 下 对 于 子 类 而 言 ， 通 过 继承 实现 是 没有 安全 你 障 的 ， 因 
为 父 类 修改 内 部 实现 细 亡 ， 它 的 功能 束 可 能 会 补 破 坏 ; 而 对 于 基 类 而 
言 ， 让 子 类 继承 和 重 写 方 法 ， 束 可 能 到 失 随 意 修改 内 部 实现 的 目 由 。 


4.4.3 ”继承 没有 反映 is-a 天 系 


继承 关系 是 设计 用 来 反映 is-a 关 系 的 ， 子 类 是 父 类 的 一 种 ， 子 类 对 
象 也 属于 父 类 ， 父 类 的 属性 和 行为 也 适用 于 子 类 。 就 像 棍 子 足 水 果 一 
样 ， 水 采 有 的 属性 和 行为 ， 橙 子 也 必然 都 有 。 


但 现实 中 ， 设 计 完 全 符合 is-a 关 系 的 继承 关系 是 困难 的 。 比 如 ， 绝 
大 部 分 乌 都 会 飞 ， 可 能 束 想 给 乌 类 增加 一 个 方法 fly () 表示 飞 ， 但 有 
一 些 乌 就 不 会 尺 ， 比 如 企 物 。 


在 is-a 天 系 中 ， 重 写 方法 时 ， 子 类 不 应 该 改变 父 类 预期 的 行为 ， 但 
是 这 是 没有 办 法 约束 的 。 还 是 以 乌 为 例 ， 你 可 能 给 父 类 增加 了 fly () 
方法 ， 对 企鹅 ， 你 可 能 想 ， 企 物 不 会 尺 ， 但 可 以 走 和 游 瀛 ， 殊 在 企鹅 
的 fy () 方法 中 ， 实 现 了 有 关 走 或 游泳 的 逻辑 。 


继承 是 应 该 被 当 作 is-a 关 系 使 用 的 ， 但 是 ，Java 并 没有 办 法 约束 ， 
父 类 有 的 属性 和 行为 ， 子 类 并 不 一 定 都 适用 ， 子 类 还 可 以 重 写 方法 ， 
实现 与 父 类 预期 完全 不 一 样 的 行为 。 

但 对 于 通过 父 类 引用 操作 子 类 对 象 的 程序 而 言 ， 它 征 把 对 象 当 作 


父 类 对 象 来 看 待 的 ， 期 望 对 象 符合 父 类 中 声明 的 属性 和 行为 。 如 采 不 
符合 ， 结 末 是 什么 呢 ? 混乱 。 


4.4.4 如 何 应 对 继承 的 双 面 性 


继承 既 强 大 又 有 破坏 性 ， 那 怎么 办 呢 ? 
1) 避免 使 用 继承 ; 
2) 正确 使 用 继承 。 
我 们 先 来 看 怎么 避免 继承 ， 有 三 种 方法 : 


.使 用 final 关 键 字 ; 

.优先 使 用 组 合 而 非 继承 ; 

.使 用 接口 。 
1. 使 用 final 避 免 继 承 

在 4.2 节 ， 我 们 提 到 过 final 类 和 final 方 法 ，final 方 法 不 能 被 重 写 ， 
final 类 不 能 被 继承 ， 我 们 没有 解释 为 什么 需要 它们 。 通 过 上 面 的 介 
绍 ， 我 们 就 应 该 能 够 理解 其 中 的 一 些 原 因 了 。 


给 方法 加 final 修 饰 特 ， 父 类 就 保留 了 随意 修改 这 个 方法 内 部 实现 
的 目 由 ， 使 用 这 个 方法 的 程序 也 可 以 确保 其 行为 是 符合 父 类 声明 的 。 

给 类 加 final 修 饰 牺 ， 父 类 就 保留 了 随意 修改 这 个 类 实现 的 目 由 ， 
使 用 者 也 可 以 放心 地 使 用 它 ， 而 不 用 担心 一 个 父 类 引用 的 变量 ， 实 际 
指 回 的 却 是 一 个 完全 不 符合 预期 行为 的 于 类 对 象 。 


2. 优 移 使 用 组 合 而 非 继承 

使 用 组 合 可 以 抵挡 父 类 变化 对 子 类 的 影响 ， 从 而 保护 子 类 ， 应 该 
优先 使 用 组 合 。 还 是 上 面 的 例子 ， 我 们 使 用 组 合 来 重 写 一 下 子 类 ， 如 
代码 清单 4-12 所 示 。 


代码 清单 4-12 ”使 用 组 合 实现 子 类 Child 


public class Child { 
private Base base; 
private long sum; 
public Child(){ 
base = new Base(); 


} 

public void add(int number) { 
base.add(number ); 
sum+=number; 


} 
public void addAll(int[] numbers) { 
base.addAll(numbers); 
for(int i=0;i<numbers.length;i++){ 
sum+=numbers[i]; 


} 
public long getSsum() { 
return sum; 


这 样 ， 子 类 就 不 需要 关注 基 类 是 如 何 实现 的 了 ， 基 类 修改 实现 细 
节 ， 增 加 公开 方法 ， 也 不 会 影响 到 子 类 了 “。 但 组 合 的 问题 是 ， 子 类 对 
象 不 能 当 作 基 类 对 象 来 统一 处 理 了 。 解 决 方法 是 使 用 接口 。 接 口 是 什 
么 呢 ? 我 们 留待 下 章 介绍 。 

3. 正 确 使 用 继承 


如 打 要 使 用 继承 ， 怎 么 正确 使 用 呢 ? 使 用 继承 大 概 主要 有 三 种 场 


旱 . 
时 : 


1) 基 类 是 别人 写 的 ， 我 们 写 子 类 ; 

2) 我 们 写 基 类 ， 别 人 可 能 写 子 类 ; 

3) 基 类 、 子 类 都 是 我 们 写 的 。 

第 1 种 场景 中 ， 基 类 主要 是 Java API、 其 他 框架 或 类 库 中 的 类 ， 在 
这 种 情况 下 ， 我 们 主要 通过 扩展 基 类 ， 实 现 目 定 义 行为 ， 这 种 情况 下 
需要 注意 的 是 : 

. 重 写 方法 不 要 改变 预期 的 行为 ; 


:阅读 文档 说 明 ， 理 解 可 重 写 方法 的 实现 机 制 ， 尤 其 是 方法 之 则 的 
依赖 关系 ; 


:在 基 类 修改 的 情况 下 ， 阅 读 其 修改 说 明 ， 相 应 修改 子 类 。 
第 2 种 场景 中 ， 我 们 写 基 类 给 别人 用 ， 在 这 种 情况 下 ， 需 要 注意 的 


反 


-使 用 继承 反映 真正 的 is-a 天 系 ， 只 将 真正 公共 的 部 分 放 到 基 类 ; 
对 不 布 望 被 重 写 的 公开 方法 添加 final 修 饰 符 ; 


` 写 文档 ， 说 明 可 重 写 方法 的 实现 机 制 ， 为 子 类 提供 指导 ， 告 诉 子 
类 应 该 如 何 重 写 ; 


在 基 类 修改 可 能 影响 子 类 时 ， 写 修改 说 明 。 


第 3 种 场景 ， 我 们 既 写 基 类 也 写 子 类 ， 关 于 基 类 ， 注 意 事项 和 第 2 
种 场景 类 似 ， 关 于 子 类 ， 注 意 事 项 和 第 1 种 场景 类 似 ， 不 过 程序 部 由 我 
们 控制 ， 要 求 可 以 适当 放松 一 些 。 


至 此 ， 关 于 继承 就 介绍 完了 ， 本 章 最 后 ， 我 们 提 到 了 一 个 概念: 
接口 ， 接 口 到 底 是 什么 呢 ? 让 我 们 下 章 探讨 。 


第 5 章 ”类 的 扩展 


之 前 我 们 一 直 在 说 ， 程 序 主 要 了 束 是 数据 以 及 对 数据 的 操作 ， 而 为 
了 方便 操作 数据 ， 高 级 语言 引入 了 数据 类 型 的 概念 。Java 定 义 了 8 种 基 
本 数据 类 型 ， 而 类 相当 于 是 目 定 义 数 据 类 型 ， 通 过 类 的 组 合 和 继承 可 
以 表示 和 操作 各 种 事物 或 者 说 对 象 。 


除了 基本 的 数据 类 型 和 类 概念 ， 还 有 一 些 扩展 概念 ， 包 括 接口 、 
抽象 类 、 内 部 类 和 枚 举 。 上 一 章 我 们 提 到 ， 继 承 有 其 两 面 性 ， 替 代 继 
承 的 一 种 方式 是 使 用 接口 ， 接 口 到 底 是 什么 呢 ? 此 外 ， 介 于 接口 和 类 
之 间 ， 还 有 一 个 概念 ， 抽象 类 ， 它 又 是 什么 呢 ? 一 个 类 可 以 定义 在 另 
一 个 类 内 部 ， 称 为 内 部 类 ， 为 什么 要 有 内 部 类 ， 它 到 底 是 什么 呢 ? 枚 
举 是 一 种 特殊 的 数据 类 型 ， 它 有 什么 用 呢 ? 本 章 就 来 探讨 这 些 概念 ， 


看 接口 。 


5.1 接口 的 本 质 


在 之 前 的 章节 中 ， 我 们 一 直 在 强调 数据 类 型 的 概念 ， 但 只 是 
象 看 作 属 于 某 种 数据 类 型 ， 并 按 该 类 型 进行 操作 ， 在 一 些 情况 下 ， 并 
不 能 反映 对 象 以 及 对 对 象 操 作 的 本 质 。 


为 什么 这 么 说 呢 ? 很 多 时 候 ， 我 们 实际 上 关心 的 ， 并 不 是 对 象 的 
类 型 ， 而 是 对 象 的 能 力 ， 只 要 能 提供 这 个 能 力 ， 类 型 并 不 重要 。 我 们 
米 看 一 些 生 活 中 的 例 了 于。 


比如 要 拍照 ， 很 多 时 候 ， 只 要 能 哲 出 符合 需求 的 照片 束 行 ， 至 于 
是 用 手机 拍 ， 还 是 用 Pad 拍 ， 或 者 是 用 单反 相机 拍 ， 并 不 重要 ， 即 关心 
的 是 对 象 是 否 有 招 出 照片 的 能 力 ， 而 并 不 关心 对 象 到 确 古 什么 类 型 ， 
手机 、Pad 或 单 肥 相机 都 可 以 。 


又 如 要 计算 一 组 数字 ， 只 要 能 计算 出 正确 结 采 即 可 ， 至 于 是 由 人 
心算 ， 用 算 组 算 ， 用 计算 融 算 ， 用 计算 机 软件 算 ， 并 不 重要 ， 即 关心 
的 是 对 象 是 否 有 计算 的 能 力 ， 而 并 不 关心 对 象 到 底 是 算 副 还 是 计算 
忠 。 


再 如 要 将 冷水 加 热 ， 只 要 能 得 到 热 水 即 可 ， 至 于 十 用 电磁 炉 加 
热 ， 用 燃气 灶 加 热 ， 还 是 用 电热 水 壶 加 热 ， 并 不 重要 ， 即 重要 的 是 对 
象 是 否 有 加 热 水 的 能 力 ， 而 并 不 关心 对 象 到 发 是 什么 类 型 。 


在 这 些 情 况 中 ， 类 型 并 不 重要 ， 重 要 的 是 能 力 。 那 如 何 表 示 能 
呢 ? 接口 。 下 面 就 来 详细 介绍 接口 ， 包 括 其 概念 、 用 法 、 一 些 细 贡 ， 
以 及 如 何 用 接口 替代 继承 。 


5.1.1 接口 的 概念 


接口 这 个 概念 在 生活 中 并 不 陌生 ， 电 子 世 界 中 一 个 常见 的 接口 就 
是 USB 接 口 。 计 算 机 往往 有 多 个 USB 接 口 ， 可 以 插 各 种 USB 设 备 ， 如 
键盘 、 鼠 标 、U 盘 、 摄 像 头 、 手 机 等 。 


接口 声明 了 一 组 能 力 ， 但 它 目 己 并 没有 实现 这 个 能 ， 它 公 古 一 
个 约定 。 接 口 涉 及 交互 两 方 对 象 ， 一方 需要 实现 这 个 接口 ， 男 一 方 使 
用 这 个 接口 ， 但 双方 对 象 并 不 直接 互相 依赖 ， 它们 只 是 通过 接口 间接 
交互 ， 如 图 5-1 所 示 。 


接口 对 象 乙 
对 象 甲 A ( 实现 接口 A ) 


图 5-1 接口 的 概念 


拿 上 面 的 USB 接 口 来 说 ，USB 了 协议 约 定 了 USB 设 备 需 要 实现 的 能 
力 ， 每 个 USB 设 备 都 需要 实现 这 些 能 力 ， 计 算 机 使 用 USB 协 议 与 USB 
设备 交互 ， 计 算 机 和 USB 设 备 互 不 依赖 ， 但 可 以 通过 USB 接 口 相 互 交 
互 。 下 面 我 们 来 看 Java 中 的 接口 。 


5.1.2” 竺 义 接口 


我 们 通过 一 个 例子 来 说 明 Java 中 接口 的 概念 。 这 个 例子 是 “ 比 
交 ”， 很 多 对 象 都 可 以 比较 ， 对 于 求 最 大 值 、 求 最 小 值 、 排 序 的 程序 而 
言 ， 它 们 其 实 并 不 关心 对 象 的 类 型 是 什么 ， 只 要 对 象 可 以 比较 就 可 以 
了 ， 或 者 说 ， 它 们 关心 的 是 对 象 有 没有 可 比较 的 能 力 。Java API 中 提 
供 了 Comparable 接 口 ， 以 表示 可 比较 的 能 力 ， 但 它 使 用 了 泛 型 ， 而 我 
们 还 没有 介绍 泛 型 ， 所 以 本 币 先 目 己 定义 一 个 Comparable 接 口 ， 叫 
MyComparable ° 


首先 来 定义 这 个 接口 ， 代 码 如 下 : 


< 


卫 


public interface MyComparable { 
int compareTo(Object other); 
} 


定义 接口 的 代码 解释 如 下 : 


1) Java 使 用 interface 这 个 关键 字 来 声明 接口 ， 修 饰 符 一 般 都 是 
public。 


2) interface 后 面 束 是 接口 的 名 字 MyComparable 。 

3) 接口 定义 里 面 ， 声明 了 一 个 方法 compareTo， 但 没有 定义 方法 
体 ，Java 8 之 前 ， 接 口内 不 能 实现 方法 。 接 口 方法 不 需要 加 修饰 从 ， 加 
与 不 加 相当 于 都 是 public abstract 。 

再 来 解释 compareTo 方 法 : 


1) 方法 的 参数 是 一 个 Object 类 型 的 变量 other， 表 示 另 一 个 参与 比 
较 的 对 和 象 。 


2) 第 一 个 参与 比较 的 对 象 是 上 自己。 


3) 返回 结果 是 int 类 型 ，-1 表 示 自 己 小 于 参数 对 象 ，0 表 示 相 同 ，1 
表示 大 于 参数 对 象 。 


接口 与 类 不 同 ， 它 的 方法 没有 实现 代码 。 定 义 一 个 接口 本 身 并 没 
有 做 什么 ， 也 没有 太 大 的 用 处 ， 它 还 需要 至 少 两 个 参与 者 : 一 个 需要 
实现 接口 ， 为 一 个 使 用 接口 。 我 们 先 来 实现 接口 。 


5.1.3 ”实现 接口 


类 可 以 实现 接口 ， 表 示 类 的 对 象 具 有 接口 所 表示 的 能 力 。 在 此 以 
上 一 草 介 绍 过 的 Point 类 来 说 明 。 我 们 让 Point 有 具备 可 以 比较 的 能 
Point 之 间 怎 么 比较 呢 ? 我 们 假设 按照 与 原点 的 距离 进行 比较 ，Point 类 
代码 如 代码 清单 5-1 所 示 。 


代码 清单 5-1 Point 类 代码 : 实现 了 MyComparable 


public class Point implements MyComparable { 
private int x; 
private int y; 
public Point(int x, int y) { 
this.x = x; 


this.y = y; 


} 
public double distance(){ 
return Math.sqrt(x*x+y*y); 


Q@Override 
public int compareTo(Object other) { 
if(!(other instanceof Point)){ 
throw new IllegalArgumentException(); 


Point otherPoint = (Point)other ， 
double delta = distance() - otherPoint ,distance() ; 
if(delta<0){ 
return -1; 
}else if(delta>0){ 
return 1; 
}elsef{ 
return ©; 


Q@Override 
public String toString() { 
return "(+x+", "+y+" )"; 
} 
} 


代码 解释 如 下 : 


1) Java 使 用 implements 这 个 天 键 字 表示 实现 接口 ， 前 面 古 类 名 ， 
后 面 是 接口 名 。 


2) 实现 接口 必须 要 实现 接口 中 声明 的 方法 ，Point 实 现 了 
compareTo 方 法 。 


再 来 解释 Point 的 compareTo 实 现 。 


1) Point 不 能 与 其 他 类 型 的 对 象 进行 比较 ， 它 首先 检查 要 比较 的 
对 象 是 否 是 Point 类 型 ， 如 果 不 是 ， 使 用 hrow 抛 出 一 个 异常 ， 异 常 将 
在 下 一 章 介绍 ， 此 处 可 以 忽略 。 


2) 如 果 是 Point 类 型 ， 则 使 用 强制 类 型 转换 将 Object 类 型 的 参数 
other 转换 为 Point 类 型 的 参数 otherPoint 。 


3) 这 种 显 式 的 类 型 检查 和 强制 转换 是 可 以 使 用 泛 型 机 制 避 免 
的 ， 第 8 章 我 们 再 介绍 泛 型 。 


一 个 类 可 以 实现 多 个 接口 ， 表 明 类 的 对 象 具备 多 种 能 力 ， 各 个 接 
口 之 间 以 逗号 分 隔 ， 语 法 如 下 所 示 : 


public class Test implements Interface1，Interface2 { 


// 主体 代码 
} 


定义 和 实现 了 接口 ， 接 下 来 我 们 来 看 怎么 使 用 接口 。 
5.1.4 使 用 接口 
与 类 不 同 ， 接 口 不 能 new， 不 能 直接 创建 一 个 接口 对 象 ， 对 象 只 


能 通过 类 来 创建 。 但 可 以 声明 接口 类 型 的 变量 ， 引 用 实现 了 接口 的 类 
对 象 。 比 如 ， 可 以 这 样 : 


MyComparable p1 = new Point(2,3); 
MyComparable p2 = new Point(1,2); 
System.out.println(pi.compareTo(p2)); 


pl 和 p2 是 MyComparable 类 型 的 变量 ， 但 引用 了 Point 类 型 的 对 和 象 ， 
之 所 以 能 赋值 是 因为 Point 实 现 了 MyComparable 接 口 。 如 果 一 个 类 型 实 
现 了 多 个 接口 ， 那 么 这 种 类 型 的 对 象 就 可 以 被 赋 值 给 任 一 接口 类 型 的 
变量 。p1 和 p2 可 以 调用 MyComparable 接 口 的 方法 ， 也 只 能 调用 
MyComparable 接 口 的 方法 ， 实 际 执 行 时 ， 执 行 的 是 具体 实现 类 的 代 


为 什么 Point 类 型 的 对 象 非 要 赋值 给 MyComparable 类 型 的 变量 呢 ? 
在 以 上 代码 中 ， 确 实 没 必要 。 但 在 一 些 程序 中 ， 代 码 并 不 知道 具体 的 
类 型 ， 这 才 是 接口 发 挥 威力 的 地 方 。 我 们 来 看 下 面 使 用 MyComparable 
接口 的 例子 ， 如 代码 清单 5-2 所 示 。 


代码 清单 5-2 ”使 用 MyComparable 的 示例 : CompUtil 


public class CompUtil { 
public static Object max(MyComparable[] objs){ 
if(objs==null||objs.length==0){ 
return null; 


} 


MyComparable max = objs[0]; 
for(int i=1i; i<objs.length; i++){ 
if(max.compareTo(objs[i])<0)t{ 
max = objs[i]; 
} 


return max; 


} 
public static void sort(Comparable[] objs)t{ 
for(int i=0; i<objs.length; i++){ 
int min = 1; 
for(int j=i+1; j<objs.length; j++){ 
if(objs[j].compareTo(objs[min])<0){ 
min = j; 
} 


} 

if(min!=i){ 
Comparable temp = objs[i]; 
objs[i] = objs[min]; 
objs[min] = temp; 


类 CompUti 提 供 了 两 个 方法 ，max 获 取 传 入 数组 中 的 最 大 值 ，sort 
对 数组 升序 排序 ， 参 数 都 是 MyComparable 类 型 的 数组 ，sort 使 用 的 是 
人 简单 选择 排序 ， 具 体 算 法 我 们 束 不 介绍 了 。 


可 以 看 出 ， 这 个 类 是 针对 MyComparable 接 口 编程 ， 它 并 不 知道 具 
体 的 类 型 是 什么 ， 也 并 不 关心 ， 但 却 可 以 对 任意 实现 了 MyComparable 
ee 的 类 型 进行 操作 。 我 们 来 看 如 何 对 Point 类 型 进行 操作 ， 代 码 如 


Point[] points = new Point[]t{ 

new Point(2,3), new Point(3,4), new Point(1,2) 
}; 
System,out,.printlLn("max: " + CompUtil.max(points)); 
CompUtil.sort(points); 
System.out.println("sort: "+ Arrays.toString(points)); 


以 上 代码 创建 了 一 个 Point 类 型 的 数组 points， 然 后 使 用 CompUtil 
的 max 方 法 获取 最 大 值 ， 使 用 sort 排 序 ， 并 输出 结果 ， 输 出 如 下 : 


max: (3,4) 
sort: [(1,2), (2,3), (3,4)] 


这 里 演示 的 是 对 Point 数 组 操作 ， 实 际 上 可 以 针对 任何 实现 了 
MyComparable 接 口 的 类 型 数组 进行 操作 。 这 束 古 接口 的 威力 ， 可 以 
说 ， 针 对 接口 而 非 具 体 类 型 进行 编程 ， 是 计算 机 程序 的 一 种 重要 思维 
方式 。 接口 很 多 时 候 反 映 了 对 象 以 及 对 对 象 操作 的 本 质 。 它 的 优点 有 
很 多 ， 首 先是 代码 复 用 ， 同 一 套 代 码 可 以 处 理 多 种 不 同类 型 的 对 象 ， 
只 要 这 些 对 象 都 有 相同 的 能 力 ， 如 CompUtil 。 


接口 更 重要 的 是 降低 了 精 合 ， 提 高 了 灵活 性 。 使 用 接口 的 代码 依 
赖 的 是 接口 本 身 ， 而 非 实 现 接口 的 具体 类 型 ， 程 序 可 以 根据 情况 殖 换 
接口 的 实现 ， 而 不 影响 接口 使 用 者 。 解 决 复杂 问题 的 天 键 是 分 而 治 
之 ， 将 复杂 的 大 问题 分 解 为 小 问题 ， 但 小 问题 之 间 不 可 能 一 点 关系 没 
有 ， 分 解 的 核心 融和 是 要 降低 耦合 ， 提 高 灵活 性 ， 接 口 为 恰当 分 解 所 供 
了 有 力 的 工具 。 


5.1.5 “接口 的 细节 


前 面 介 绍 了 接口 的 基本 内 容 ， 接 口 还 有 一 些 细节 ， 包 括 : 
-接口 中 的 变量 。 

-接口 的 继承 。 

-类 的 继承 与 接口 。 

"instanceof 。 

下 面具 体 介绍 。 

(1) 接口 中 的 变量 

接口 中 可 以 定义 变量 ， 语 法 如 下 所 示 : 


public interface Interface1 f{ 
public static final int a = 0; 


这 里 定义 了 一 个 变量 inta， 修 饰 符 是 public static final ， 但 这 个 修 


(2) 接口 的 继承 


接口 也 可 以 继承 ， 一 个 接口 可 以 继承 其 他 接口 ， 继 承 的 基本 概念 
与 类 一 样 ， 但 与 类 不 同 的 是 ， 接 口 可 以 有 多 个 父 接口 ， 代 码 如 下 所 
和 个 : 


public interface IBase1 { 
void method1(); 


public interface IBase2 { 
void method2(); 


} 
public interface IChild extends IBasel1, IBase2 { 


IChild 有 IBasel 和 IBase2 两 个 父 类 ， 接 口 的 继承 同样 使 用 extends 关 
键 子 ， 多 个 父 授 口 之 间 以 逗号 分 隔 。 


(3) 类 的 继承 与 接口 


类 的 继承 与 接口 可 以 共存 ， 换 句 话 说， 类 可 以 在 继承 基 类 的 情况 
下 ， 同 时 实现 一 个 或 多 个 接口 ， 语 法 如 下 所 示 : 


public class Child extends Base implements IChild { 
// 主 体 代码 
} 


关键 字 extends 要 放 在 implements 之 前 。 
(4) instanceof 


与 类 一 样 ， 接 口 也 可 以 使 用 instanceof 关 键 字 ， 用 来 判断 一 个 对 象 
是 否 实现 了 某 接口 ， 例 如 ; 


Point p = new Point(2,3); 
if(p instanceof MyComparab1le){ 


System.out.println("comparable"); 


5.1.6 ”使 用 接口 蔡 代 继承 


上 一 革 我 们 提 人 到， 可 以 使 用 组 合 和 接口 奉 代 继承 。 怎 么 蔡 代 呢 ? 


继承 至 少 有 两 个 好 处 : 一 个 是 复 用 代码 ; 另 一 个 是 利用 多 态 和 动 
态 绑 定 统一 处 理 多 种 不 同 子 类 的 对 象 。 使 用 组 合 奉 代 继 承 ， 可 以 复 用 
代码 ， 但 不 能 统一 处 理 。 使 用 接口 替代 继承 ， 针 对 接口 编程 ， 可 以 实 
现 统 一 处 理 不 同类 型 的 对 象 ， 但 接口 没有 代码 实现 ， 无 法 复 用 代码 。 
en 


村 我 们 还 是 以 4.4 广 的 例子 来 说 明 ， 先 增加 一 个 接口 IAdd， 代 码 如 


public interface IAdd { 

void add(int number); 

void addAll(int[] numbers); 
} 


修改 Base 代 码 ， 让 它 实 现 IAdd 接 口 ， 代 码 基本 不 变 : 


public class Base implements IAdd { 
// 主 体 代码 ， 与 代码 清单 4-19 一 样 
} 


修改 Child 代 码 ， 也 是 实现 IAdd 接 口 ， 代 码 基 本 不 变 : 


public class Child implements IAdd { 
// 主 体 代码 ， 组 合 使 用 Base， 与 代码 清单 4-12 一 样 


Child 复 用 了 Base 的 代码 ， 又 都 实现 了 IAdd 接 口 ， 这 样 ， 既 复 用 代 
码 ， 又 可 以 统一 处 理 ， 还 不 用 担心 破坏 封装 。 


5.1.7 ” Java 8 和 Java 9 对 接口 的 增强 


需要 说 明 的 是 ， 前 面 介 绍 的 都 是 Java 8 之 前 的 接口 概念 ，Java 8 和 
Java 9 对 接口 做 了 一 些 增强 。 在 Java 8 之 前 ， 接 口中 的 方法 都 是 抽象 方 
法 ， 都 没有 实现 体 ，Java 8 允许 在 接口 中 定义 两 类 新 方法 : 静态 方法 和 
默认 方法 ， 它 们 有 实现 体 ， 比 如 : 


public interface IDemo { 
void hello(); 
public static void test() { 
System.out.println("hello"),; 


} 
default void hi() { 
System.out.println("hi"),; 
} 
} 


test () 就 是 一 个 静态 方法 ， 可 以 通过 IDemo.test () 调用 。 在 接 
口 不 能 定义 静态 方法 之 前 ， 相 关 的 静态 方法 往往 定义 在 单独 的 类 中 ， 
比如 ，Java API 中 ，Collection 接 口 有 一 个 对 应 的 单独 的 类 Collections， 
在 Java 8 中 ， 束 可 以 直接 写 在 接口 中 了 ， 比 如 Comparator 接 口 就 定义 了 
多 个 静态 方法 。 


hi () 是 一 个 默认 方法 ， 用 关键 字 default 表 示 。 默 认 方法 与 抽象 
方法 都 十 接口 的 方法 ， 不 同 在 于 ， 默 认 方法 有 默认 的 实现 ， 实 现 类 可 
以 改变 它 的 实现 ， 也 可 以 不 改变 。 引 入 点 认 方法 主要 是 玉 数 式 数 据 处 
理 的 需求 ， 征 为 了 便于 给 接口 增加 功能 。 天 于 男 数 式 数据 处 理 ， 会 在 
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在 没有 默认 方法 之 前 ，Java 是 很 难 给 接口 增加 功能 的 ， 比 如 List 接 
口 〈 第 9 章 介 绍 ) ， 因 为 有 太 多 非 Java JDK 控 制 的 代码 实现 了 该 接口 ， 
如 果 给 接口 增加 一 个 方法 ， 则 那些 接口 的 实现 就 无 法 在 新 版 Java 上 运 
行 ， 必 须 改 写 代 码 ， 实 现 新 的 方法 ， 这 显然 是 无 法 接受 的 。 函 数 式 数 
据 处 理 需 要 给 一 些 接 口 增加 一 些 新 的 方法 ， 所 以 就 有 了 默认 方法 的 概 
念 ， 接 口 增加 了 新 方法 ， 而 接口 现 有 的 实现 类 也 不 需要 必须 实现 。 看 
一 些 例 子 ，List 接 口 增加 了 sort 方 法 ， 其 定义 为 : 


default void sort(Comparator<? super E> c) { 
Object[] a = this.toArray(); 
Arrays.sort(a, (Comparator) c); 


ListIiterator<E> i = this.listIiterator(); 
for(Object e : a) { 

i.next(); 

i.set((E) e); 


Collection 接 口 增 加 了 stream 方 法 ， 其 定义 为 : 


default Stream<E> stream() { 
return StreamSupport.stream(spliterator(), false); 


} 


在 Java 8 中 ， 静 态 方法 和 默认 方法 都 必须 是 public 的 ，Java 9 去 除 
了 这 个 限制 ， 它 们 都 可 以 是 private 的 ， 引 入 private 方 法 主要 是 为 了 方 
便 多 个 静态 或 默认 方法 复 用 代码 ， 比 如 : 


public interface IDemoPrivate { 
private void common() { 
System.out.println("common"); 


} 
default void actionA() { 
common( ); 


} 
default void actionB() { 
common( ); 


这 里 ，actionA 和 actionB 两 个 默认 方法 共享 了 相同 的 common () 
方法 的 代码 。 


5.1.8 小 绪 


本 节 我 们 谈 了 数据 类 型 思维 的 局 限 ， 提 到 了 很 多 时 候 关 心 的 十 能 
力 ， 而 非 类 型 ， 所 以 引入 了 接口 ， 介 绍 了 Java 中 接口 的 概念 和 细 记 。 
针对 接口 编程 是 一 种 重要 的 程序 思维 方式 ， 这 种 方式 不 仅 可 以 复 用 代 
2 还 可 以 降低 硝 合 ， 提 高 灵活 性 ， 十 分 解 复杂 问题 的 一 种 重要 工 


接口 不 能 创建 对 象 ， 没 有 任何 实现 代码 (Java 8 之 前 ) ， 而 之 前 介 
绍 的 类 都 有 完整 的 实现 ， 都 可 以 创建 对 象 。Java 中 还 有 一 个 介 于 接口 
和 类 之 间 的 概念 ， 抽象 类 ， 它 有 什么 用 呢 ? 


5.2 ”抽象 类 


顾名思义 ， 抽 和 象 类 就 是 抽象 的 类 。 抽 象 是 相对 于 具体 而 言 的 ， 一 
般 而 言 ， 具 体 类 有 直接 对 应 的 对 象 ， 而 抽象 类 没有 ， 它 表达 的 是 抽象 
概念 ， 一 般 是 具体 类 的 比较 上 层 的 父 类 。 比 如 ， 狗 是 具体 对 象 ， 而 动 
物 则 是 抽象 概念 ， 楼 桃 是 具体 对 象 ， 而 水 果 则 是 抽象 概念 ， 正 方形 是 
具体 对 象 ， 而 图 形 则 是 抽象 概念 。 下 面 我 们 通过 图 形 人 处理 中 的 一 些 概 
念 来 说 明 Java 中 的 抽象 类 。 


5.2.1 抽象 方法 和 抽象 类 


之 前 我 们 介绍 过 图 形 类 Shape， 它 有 一 个 方法 draw () 。Shape 其 
实 是 一 个 抽象 概念 ， 它 的 draw () 方法 其 实 并 不 知道 如 何 实现 ， 只 
。 这 种 只 有 子 类 才 知 道 如 何 实现 的 方法 ， 一 般 被 定义 为 抽 
法 。 


抽象 方法 是 相对 于 具体 方法 而 言 的 ， 具 体 方法 有 实现 代码 ， 而 抽 
象 方法 只 有 声明 ， 没 有 实现 。 上 市 介绍 的 接口 中 的 方法 〈 非 Java 8 引入 
的 静态 和 默认 方法 ) 就 都 是 抽象 方法 。 


”抽象 方法 和 抽象 类 都 使 用 abstract 这 个 关键 字 来 声明 ， 语 法 如 下 所 
万: 


public abstract class Shape { 
// 其 他 代码 


public abstract void draw(); 


} 


定义 了 抽象 方法 的 类 必须 被 声明 为 抽象 类 ， 不 过 ， 抽 象 类 可 以 没 
有 抽象 方法 。 抽 象 类 和 具体 类 一 样 ， 可 以 定义 具体 方法 、 实 例 变 量 
等 ， 它 和 具体 类 的 核心 区 别 是 ， 抽 和 象 类 不 能 创建 对 象 比如， 不 能 使 
用 new Shape () ) ， 而 具体 类 可 以 。 


抽象 类 不 能 创建 对 象 ， 要 创建 对 象 ， 必 须 使 用 它 的 具体 子 类 。 一 
个 类 在 继承 抽象 类 后 ， 必 须 实现 抽象 类 中 定义 的 所 有 抽象 方法 ， 除 非 
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已 目 己 也 声明 为 抽象 类 。 圆 类 的 实现 代码 ， 如 下 所 示 : 
public class Circle extends Shape { 
// 其 他 代码 
Q@Override 
public void draw() { 
// 主 体 代码 


} 


} 


加 实现 了 draw () 方法 。 与 接口 类 似 ， 抽 象 类 虽然 不 能 使 用 
但 可 以 声明 抽象 类 的 变量 ， 引 用 抽象 类 具体 子 类 的 对 象 ， 如 下 
人: 


Shape shape = new Circle(); 
shape.draw( ); 


shape 是 抽象 类 Shape 类 型 的 变量 ， 引 用 了 有 具体 子 类 Circle 的 对 象 ， 
调用 draw () 方法 将 调用 Cirde 的 draw 代 人 码 。 


5.2.2 为 什么 需要 抽象 类 


抽象 方法 和 抽象 类 看 上 去 是 多 余 的 ， 对 于 抽象 方法 ， 不 知道 如 何 
实现 ， 定 义 一 个 空 方法 体 不 束 行 了 吗 ? 而 抽象 类 不 让 创建 对 象 ， 看 上 
去 只 是 增加 了 一 个 不 必要 的 限制 。 


引入 抽象 方法 和 抽象 类 ， 是 Java 提 供 的 一 种 语法 工具 ， 对 于 一 些 
类 和 方法 ，3 引 导 使 用 者 正确 使 用 它们 ， 减 少 误 用 。 使 用 抽象 方法 而 非 
空 方法 体 ， 子 类 就 知道 它 必须 要 实现 该 方法 ， 而 不 可 能 忽略 ， 若 忽略 
Java 编 译 融 会 提示 错误 。 使 用 抽象 类 ， 类 的 使 用 者 创 建 对 象 的 时 候 ， 
忠 知 道 必须 要 使 用 某 个 具体 子 类 ， 而 不 可 能 认 用 不 完整 的 父 类 。 


无 论 是 编写 程序 ， 还 是 平时 做 其 他 事情 ， 每 个 人 都 可 能 会 犯错 ， 
减少 错误 不 能 只 依赖 人 的 优秀 素质 ， 还 需要 一 些 机 制 ， 使 得 一 个 普通 
， 而 难以 把 事情 做 错 。 抽 象 类 吏 是 Java 提 供 的 这 

人 中 


5.2.3 ”抽象 类 和 接口 


抽象 类 和 接口 有 类 似 之 处 ; 都 不 能 用 于 创建 对 象 ， 接 口中 的 方法 
其 实 都 是 抽象 方法 。 如 果 抽 和 象 天 中 只 定义 了 抽象 方法 ， 那 抽象 类 和 接 
口 殉 更 像 了 。 但 抽象 类 和 接口 根本 上 十 不 同 的， 接口 中 不 能 定义 实例 
而 抽象 类 可 以 ， 一 个 类 可 以 实现 多 个 接口 ， 但 只 能 继承 一 个 


抽象 类 和 接口 是 配合 而 非 雁 代 关 系 ， 它 们 经 党 一 起 使 用 ， 接 口 声 
明 能 力 ， 抽 象 类 提供 默认 实现 ， 实 现 全 部 或 部 分 方法 ， 一 个 接口 经 常 
有 一 个 对 应 的 抽象 类 。 比如 ， 在 Java 类 库 中 ， 有 : 

Collection 接口 和 对 应 的 AbstractCollection 抽 象 类 。 

List 接口 和 对 应 的 AbstractList 抽 象 类 。 

.Map 接 口 和 对 应 的 AbstractMap 抽 象 类 。 

对 于 需要 实现 接口 的 具体 类 而 言 ， 有 两 个 选择 : 一 个 是 实现 接 
己 实现 全 部 方法 ， 男 一 个 则 是 继承 抽象 类 ， 然 后 根据 需要 重 写 

yn 

继承 的 好 处 是 复 用 代码 ， 只 重 写 需 要 的 部 分 即 可 ， 需 要 编写 的 代 
码 比较 少 ， 容 易 实现 。 不 过 ， 如 果 这 个 具体 类 已 经 有 父 类 了 ， 那 就 只 
能 选择 实现 接口 了 。 


我 们 以 一 个 例子 来 进一步 说 明 这 种 配合 关系 。 前 面 引 入 了 IAdd 接 
口 ， 我 们 实现 一 个 抽象 类 AbstractAdder， 代 码 如 下 : 


public abstract class AbstractAdder implements IAdd { 
Q@override 
public void addAll(int[] numbers) { 
for(int num : numbers){ 
add(num); 


这 个 抽象 类 提供 了 addAll 方 法 的 实现 ， 它 通过 调用 add 方 法 来 实 
现 ， 而 add 方 法 是 一 个 抽象 方法 。 这 样 ， 对 于 需要 实现 ITAdd 接 口 的 类 来 


说 ， 它 可 以 选择 直接 实现 IAdd 接 口 ， 或 者 从 AbstractAdder 类 继承 ， 如 
果 继 承 ， 只 需要 实现 add 方 法 就 可 以 了 。 这 里 ， 我 们 让 原 有 的 Base 类 继 
承 AbstractAdder， 代 码 如 下 所 示 : 


public class Base extends AbstractAdder { 
private static final int MAX_NUM = 1000; 
private int[] arr = new int[MAX_NUM]; 
private int count 
Q@override 
public void add(int number ){ 
if(count<MAX_NUM)E 
arr[count++] = number; 
} 
} 
} 
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本 节 介 绍 了 抽象 类 ， 相 对 于 具体 类 ， 它 用 于 表达 抽象 概念 ， 虽 然 
从 语法 上 抽象 类 不 是 必需 的 ， 但 它 能 使 程序 更 为 清晰 ， 可 以 减少 误 
用 。 抽 象 类 和 接口 经 常 相互 配合 ， 接 口 定 义 能 力 ， 而 抽象 类 提供 默认 
实现 ， 方 便 子 类 实现 接口 。 

在 目前 天 于 类 的 摘 述 中 ， 每 个 类 都 是 独立 的 ， 部 对 应 一 个 Java 源 


代码 文件 ， 但 在 Java 中 ， 一 个 类 还 可 以 放 在 男 一 个 类 的 内 部 ， 称 之 为 
内 部 类 。 为 什么 要 将 一 个 类 放 到 别 的 类 内 部 呢 ? 让 我 们 下 市 探讨 。 


5.3 ”内 部 类 的 本 质 


之 前 我 们 所 说 的 类 都 对 应 于 一 个 独立 的 Java 源 文件 ， 但 一 个 类 还 
nn 


一 般 而 言 ， 内 部 类 与 包含 它 的 外 部 类 有 比较 密切 的 关系 ， 而 与 其 
他 类 关系 不 大 ， 定 义 在 类 内 部 ， 可 以 实现 对 外 部 完全 隐藏 ， 可 以 有 更 
好 的 封装 性 ， 代 码 实 现 上 也 往往 更 为 简洁 。 

不 过 ， 内 部 类 只 是 Java 编 译 需 的 概念 ， 对 于 Java 虚 拟 机 而 言 ， 它 
征 不 知道 内 部 类 这 回 事 的 ， 每 个 内 部 类 最 后 都 会 被 编译 为 一 个 独立 的 
类 ， 生 成 一 个 独立 的 字 节 码 文件 。 

也 束 古 说 ， 每 个 内 部 类 其 实 部 可 以 被 蔡 换 为 一 个 独立 的 类 。 当 
然 ， 这 是 单纯 就 技术 实现 而 言 。 内 部 类 可 以 方便 地 访问 外 部 类 的 私有 
变量 ， 可 以 声明 为 private 从 而 实现 对 外 完全 隐藏 ， 相 关 代 码 写 在 一 
起 ， 写 法 也 更 为 简 尘 ， 这 些 都 是 内 部 类 的 好 处 。 

在 Java 中 ， 根 据 定 义 的 位 置 和 方式 不 同 ， 主 要 有 4 种 内 部 类 。 

-静态 内 部 类 。 

:成 员 内 部 类 。 

方法 内 部 类 。 

匿名 内 部 类 。 

其 中 ， 方 法 内 部 类 是 在 一 个 方法 内 定义 和 使 用 的 ; 匿名 内 部 类 使 
用 范围 更 小 ， 它 们 都 不 能 在 外 部 使 用 ; 成 员 内 部 类 和 静态 内 部 类 可 以 
被 外 部 使 用 ， 不 过 它们 都 可 以 被 声明 为 private， 这 样 ， 外 部 束 不 能 使 
ee 

时 “ 


5.3.1 静态 内 部 类 


静态 内 部 类 与 静 仿 变量 和 静 仿 方法 定义 的 位 置 一 样 ， 也 带 有 static 
关键 子 ， 只 是 它 定义 的 是 类 ， 下 面 我 们 介绍 它 的 语法 、 实 现 原 理 和 应 
用 场景 。 我 们 看 个 静态 内 部 类 的 例子 ， 如 代码 清单 5-3 所 示 。 


代码 清单 5-3 ”静态 内 部 类 示例 


public class Outer { 
private static int shared = 100; 
public static class StaticInner { 
public void innerMethod(){ 
System,.out,println("inner " + shared); 


} 


} 
public void test(){ 
StaticInner si = new StaticInner(); 
si,.innerMethod(); 
} 
} 


外 部 类 为 Outer， 静 态 内 部 类 为 StaticInner， 带 有 static 修 响 符 。 话 
法 上 上， 静态 内 部 类 除了 位 置 放 在 其 他 类 内 部 外 ， 它 与 一 个 独立 的 类 差 
别 不 大 ， 可 以 有 静态 变量 、 静 态 方 法 、 成 员 方法 、 成 员 变 量 、 构 造 方 


法 等 。 


静态 内 部 类 与 外 部 类 的 联系 也 不 大 (与 其 他 内 部 类 相 比 ) 。 它 可 
以 访问 外 部 类 的 静态 变量 和 方法 ， 如 innerMethod 直 接 访 问 shared 变 
量 ， 但 不 可 以 访问 实例 变量 和 方法 。 在 类 内 部 ， 可 以 直接 使 用 内 部 静 
态 类 ， 如 test () 方法 所 示 。 


public 静 仿 内 部 类 可 以 被 外 部 使 用 ， 只 是 需要 通过 “外 部 类 .静态 内 
部 类 ”的 方式 使 用 ， 如 下 所 示 : 


Outer .StaticInner si = new Outer.StaticInner(); 
si,.innerMethod(); 


静态 内 部 类 是 怎么 实现 的 呢 ? 代码 清单 5-3 所 示 的 代码 实际 上 会 生 
成 两 个 类 : 一 个 是 Outer， 男 一 个 是 Outer$StaticInner， 代 码 大 概 如 代码 
清单 5-4 所 示 。 


代码 清单 5-4 静态 内 部 类 示例 的 内 部 实现 


public class Outer { 
private static int shared = 100 
public void test(){ 
Outer$StaticInner si = new Outer$StaticInner()， 
si,.innerMethod(); 


static int access$0(){ 
return Shared 
} 


} 
public class Outer$StaticInner { 
public void innerMethod() { 
System,.out,println("inner " + Outer.access$0()); 


内 部 类 访问 了 外 部 类 的 一 个 私有 静态 变量 shared， 而 我 们 知道 私 
有 变量 是 不 能 被 类 外 部 访问 的 ，Java 的 解决 方法 是 : 上 自动 为 Outer 生 成 
一 个 非 私有 访问 方法 access$0， 它 返回 这 个 私有 静态 变量 shared。 


静态 内 部 类 的 使 用 场景 是 很 多 的 ， 如 采 它 与 外 部 类 关系 密切 ， 且 
不 依赖 于 外 部 类 实例 ， 则 可 以 考虑 定义 为 静态 内 部 类 。 比 如 ， 一 个 类 
内 部 ， 如 果 既 要 计算 最 大 值 ， 又 要 计算 最 小 值 ， 可 以 在 一 次 遍历 中 将 
最 大 值 和 最 小 值 都 计算 出 来 ,但 怎么 返回 呢 ? 可 以 定义 一 个 类 Pair， 
包括 最 大 值 和 最 小 值 ， 但 Pair 这 个 名 字 太 普 裔 ， 而 且 它 主要 是 类 内 部 
使 用 的 ， 就 可 以 定义 为 一 个 静态 内 部 类 。 


我 们 也 可 以 看 一 些 在 Java API 中 使 用 静态 内 部 类 的 例子 : 


.Integer 类 内 部 有 一 个 私有 静态 内 部 类 IntegerCache， 用 于 文 持 整数 
的 自动 装 箱 。 


表示 链表 的 LinkedList 类 内 部 有 一 个 私有 静态 内 部 类 Node， 表 示 
大 表 由 的 每 小 站 导 


.Character 类 内 部 有 一 个 public 静 态 内 部 类 UnicodeBlock， 用 于 表示 
一 个 Unicode block 。 


以 上 一 些 类 的 细 市 我 们 在 后 续 草 节 会 再 介绍 。 


5.3.2 成员 内 部 类 


与 静态 内 部 类 相 比 ， 成 员 内 部 类 没有 static 修 炳 符 ， 少 了 一 个 static 
修饰 符 ， 含 义 有 很 大 不 同 ， 下 面 我 们 详细 讨论 。 .我 们 着 个 成 员 内 部 类 
的 例子 ， 如 代码 清单 5-5 所 示 。 


代码 清单 5-5 ”成 员 内 部 类 示例 


public class Outer { 
private int a = 100; 
public class Inner 
public void innerMethod(){ 
System.out.println("outer a " +a); 
Outer .this.action(); 


} 


private void action(){ 
System.out.println("action"); 


public void test(){ 
Inner inner = new Inner(); 
inner.innerMethod( ); 
} 
} 


Inner 就 是 成 员 内 部 类 ， 与 静态 内 部 类 不 同 ， 除 了 静态 变量 和 方 
法 ， 成 员 内 部 类 还 可 以 直接 访问 外 部 类 的 实例 变量 和 方法 ， 如 
innerMethod 直 接 访 问 外 部 类 私有 实例 变量 a。 成 员 内 部 类 还 可 以 通 
过 “外 部 类 .this.xxx” 的 方式 引用 外 部 类 的 实例 变量 和 方法 ， 如 
Outer.this.action () ， 这 种 写法 一 般 在 重 名 的 情况 下 使 用 ， 如 果 没 有 
重 名 ， 那 么 “外 部 类 .this.” 是 多 余 的 。 


在 外 部 类 内 ， 使 用 成 员 内 部 类 与 静态 内 部 类 是 一 样 的 ， 直 接 使 用 
即 可 ， 如 test () 方法 所 示 。 与 静态 内 部 类 不 同 ， 成 员 内 部 类 对 象 总 是 
与 一 个 外 部 类 对 象 相连 的 ， 在 外 部 使 用 时 ， 它 不 能 直接 通过 new 
OuterInner () 的 方式 创建 对 象 ， 而 是 要 先 将 创建 一 个 Outer 类 对 象 ， 
代码 如 下 所 示 : 


Outer outer = new Outer(); 
Outer.Inner inner = outer.new Inner(); 
inner.innerMethod( ); 


创建 内 部 类 对 象 的 语法 是 “外 部 类 对 象 .new 内 部 类 () ”， 如 


outer.new Inner () 。 


与 静态 内 部 类 不 同 ， 成 员 内 部 类 中 不 可 以 定义 静态 变量 和 方法 
(final 变 量 例外 ， 它 等 同 于 常量 ) ， 下 面 介绍 的 方法 内 部 类 和 匿名 内 
部 类 也 都 不 可 以 。Java 为 什么 要 有 这 个 规定 呢 ? 可 以 这 么 理解 ， 这 些 
内 部 类 是 与 外 部 实例 相连 的 ， 不 应 独立 使 用 ， 而 静态 变量 和 方法 作为 
类 型 的 属性 和 方法 ， 一 般 是 独立 使 用 的 ， 在 内 部 类 中 意义 不 大 ， 而 如 
林内 部 类 确实 需要 静态 变量 和 方法 ， 那 么 也 可 以 挪 到 外 部 类 中 。 


成 员 内 部 类 背后 是 怎么 实现 的 呢 ? 代码 清单 5-5 也 会 生成 两 个 类 : 
一 个 是 Outer， 男 一 个 是 Outer$Inner， 它 们 的 代码 大 概 如 代码 清单 5-6 所 
不 。 


代码 清单 5-6 ”成员 内 部 类 示例 的 内 部 实现 


public class Outer { 
private int a = 100; 
private void action() { 
System.out.println("action"); 


} 

public void test() { 
Outer$Inner inner = new Outer$Inner(this); 
inner.innerMethod( ); 


static int access$0(Outer outer) { 
return outer.a; 


} 

static void access$1(Outer outer) { 
outer .action( ); 

} 


} 
public class Outer$Inner { 
final Outer outer; 
public Outer$Inner(Outer outer){ 
ths.outer = outer,; 


public void innerMethod() { 
System.out.println("outer a " + Outer.access$0(outer)); 
Outer .access$1(outer); 
} 
} 


Outer$Inner 类 有 个 实例 变量 outer 指 向 外 部 类 的 对 象 ， 它 在 构造 方 
法 中 被 初始 化 ，Outer 在 新 建 Outer$gInner 对 象 时 给 它 传 递 当 前 对 象 ， 由 
于 内 部 类 访问 了 外 部 类 的 私有 变量 和 方法 ， 外 部 类 Outer 生 成 了 两 个 非 
私有 静态 方法 : access$0 用 于 访问 变量 a，access$1 用 于 访问 方法 


action ° 


成 员 内 部 类 有 哪些 应 用 场景 呢 ? 如 采 内 部 类 与 外 部 类 关系 密切 ， 
需要 访问 外 部 类 的 实例 变量 或 方法 ， 则 可 以 考虑 定义 为 成 员 内 部 类 。 
外 部 类 的 一 些 方法 的 返回 值 可 能 是 某 个 接口 ， 为 了 返回 这 个 接口 ， 外 
部 类 方法 可 能 使 用 内 部 类 实现 这 个 接口 ， 这 个 内 部 类 可 以 被 设 为 


private， 对 外 完全 隐藏 


比如 ， 在 Java API 的 类 LinkedList 中 ， 它 的 两 个 方法 listIterator 和 
descendingIterator 的 返回 值 都 是 接口 Iterator， 调 用 者 可 以 通过 Iterator 接 
口 对 链表 遍历 ，listIterator 和 descend-ingIterator 内 部 分 别 使 用 了 成 员 内 
部 类 ListItr 和 DescendingIterator， 这 两 个 内 部 类 都 实现 了 接口 Iterator 。 
关于 LinkedList， 第 9 章 会 详细 介绍 。 


5.3.3 ”方法 内 部 类 


ee "我们 看 个 例 了 于 ， 如 代码 清单 
5-7DT 不 。 


代码 清单 5-7 方法 内 部 类 示例 


public class Outer { 
private int a = 100; 
public void test(final int param){ 
final String Str = "hello"; 
class Inner { 
public void innerMethod(){ 
System.out.println("outer a " +a); 
System.out.printlin("param " +param); 
System.out.println("local var " +str); 


Inner inner = new Inner(); 
inner.innerMethod( ); 


类 Inner 定 义 在 外 部 类 方法 test 中 ， 方 法 内 部 类 只 能 在 定义 的 方法 内 
家 使 用 。 如 采 方 法 是 实例 方法 ， 则 除了 静态 变量 和 方法 ， 内 部 类 还 可 
以 直接 访问 外 部 类 的 实例 变量 和 方法 ， 如 innerMethod 直 接 访问 了 外 部 
私有 实例 变量 a。 如 琳 方 法 是 静态 方法 ， 则 方法 内 部 类 只 能 访问 外 部 类 
的 静态 变量 和 方法 。 方 法 内 部 类 还 可 以 直接 访问 方法 的 参数 和 方法 中 


的 局 部 变量 ， 不 过 ， 这 些 变 量 必 须 被 声明 为 final， 如 innerMethod 直 接 
访问 了 方法 参数 param 和 局 部 变量 str。 


方法 内 部 类 是 怎么 实现 的 呢 ? 对 于 代码 清单 5-7， 系 统 生 成 的 两 个 
类 代码 大 概 如 代码 请 单 5-8 所 示 。 


代码 清单 5-8 ”方法 内 部 类 示例 的 内 部 实现 


public class Outer { 
private int a = 100; 
public void test(final int param) { 
final String str = "hello"; 
OuterInner inner = new OuterIinner(this, param); 
inner.innerMethod( ); 


static int access$0(Outer outer)t{ 
return outer.a; 
} 


public class OuterInner { 
Outer outer; 
int param; 
OuterInner(Outer outer, int param){ 
this.outer = outer,; 
this.param = param， 


public void innerMethod() { 
System.out.println("outer a " + Outer.access$0(this.outer)); 
System.out.println("param " + param); 
System.out.printjn("local var " + "hello"); 
} 
} 


与 成 员 内 部 类 类 似 ，OuterInner 类 也 有 一 个 实例 变量 outer 指 向 外 部 
对 象 ， 在 构造 方法 中 被 初始 化 ， 对 外 部 私有 实例 变量 的 访问 也 是 通过 
Outer 添 加 的 方法 access$0 来 进行 的 。 


方法 内 部 类 可 以 访问 方法 中 的 参数 和 局 部 变量 ， 这 是 通过 在 构造 
方法 中 传递 参数 来 实现 的 ， 如 OuterInner 构 造 方 法 中 有 参数 int param ， 
在 新 建 OuterInner 对 象 时 ，Onuter 类 将 方法 中 的 参数 传递 给 了 内 部 类 ， 
如 OuterInner inner=new OuterInner (this，param) ; 。 在 上 面 的 代码 
中 ，String str 并 没有 人 被 作为 参数 传递 ， 这 是 因为 它 被 定义 为 了 常量 ， 
在 生成 的 代码 中 ， 可 以 直接 使 用 它 的 值 。 


这 也 解释 了 为 什么 方法 内 部 类 访问 外 部 方法 中 的 参数 和 局 部 变量 
时 ， 这 些 变 量 必须 被 声明 为 fnal， 因 为 实际 上 ， 方法 内 部 类 操作 的 并 


不 是 外 部 的 变量 ， 而 和 是 它 目 己 的 实例 变量 ， 只 是 这 些 变量 的 值 和 外 部 
一 样 ， 对 这 些 变量 赋值 ， 并 不 会 改变 外 部 的 值 ， 为 避免 混淆 ， 所 以 干 


脆 强 制 规定 必须 声明 为 final 。 


如 有 果 的 确 需 要 修改 外 部 的 变量 ， 那 么 可 以 将 变量 改 为 只 含 该 变量 
的 数组 ， 修 改 数 组 中 的 值 ， 如 代 碍 清单 Sg 所 未。 


代码 清单 5-9 方法 内 部 类 修改 外 部 变量 实例 


public class Outer { 
public void test(){ 
final String[] str = new String[]{"hello"}; 
class Inner { 
public void innerMethod(){ 
str[0] = "hello world"; 


Inner inner = new Inner(); 
inner.innerMethod( ); 
System.out.printljn(str[0]); 


str 是 一 个 只 含 一 个 元 素 的 数组 ， 方 法 内 部 类 不 能 修改 st 本身， 但 
可 以 修改 它 的 数组 元 素 。 


通过 前 面 介绍 的 语法 和 原理 可 以 看 出 ， 方 法 内 部 类 可 以 用 成 员 内 
部 类 代替 ， 至 于 方法 参数 也 可 以 作为 参数 传递 给 成 员 内 部 类 。 不 
过 ， 如 采 类 只 在 某 个 方法 内 被 使 用 ， 使 用 方法 内 部 类 ， 可 以 实现 更 好 


的 封装 
5.3.4 匿名 内 部 类 


与 前 面 介 绍 的 内 部 类 不 同 ， 匿 名 内 部 类 没有 单独 的 类 定义 ， 它 在 
创建 对 象 的 同时 定义 关 语 该 如 下 : 


a 
部 类 实现 部 分 


( 
// 匿 名 内 


匿名 内 部 类 十 与 new 关 联 的 ， 在 创建 对 象 的 时 候 定义 类 ，new 后 面 
是 父 类 或 者 父 接口 ， 然 后 是 圆 括号 () ， 里 面 可 以 是 传递 给 父 类 构造 
方法 的 参数 ， 最 后 是 大 括号 {} ， 里 面 是 类 的 定义 。 

看 个 具体 的 例子 ， 如 代码 清单 5-10 所 示 。 


代码 清单 5-10 ”匿名 内 部 类 示例 


public class Outer { 
public void test(final int x, final int y){ 
Point p = new Point(2,3){ 
QOverride 
public double distance() 
return distance(new Point(x,y)); 
} 


}; 
System.out.println(p.distance( )); 


创建 Point 对 象 的 时 候 ， 定 义 了 一 个 匿名 内 部 类 ， 这 个 类 的 父 类 是 
Point， 创 建 对 象 的 时 候 ， 给 父 类 构造 方法 传递 了 参数 2 和 3， 重 写 了 
distance () 方法 ， 在 方法 中 访问 了 外 部 方法 final 参 数 x 和 y。 


匿名 内 部 类 只 能 被 使 用 一 次 ， 用 来 创建 一 个 对 象 。 它 没有 名 字 ， 
没有 构造 方法 ， 但 可 以 根据 参数 列表 ， 调 用 对 应 的 父 类 构造 方法 。 它 
可 以 定义 实例 变量 和 方法 ， 可 以 有 初始 化 代码 块 ， 初 始 化 代码 块 可 以 
起 到 构造 方法 的 作用 ， 只 是 构造 方法 可 以 有 多 个 ， 而 初始 化 代码 块 只 
能 有 一 份 。 因 为 没有 构造 方法 ， 它 目 己 无 法 接受 参数 ， 如 果 必 须要 参 
数 ， 则 应 该 使 用 其 他 内 部 类 。 与 方法 内 部 类 一 样 ， 匿 名 内 部 类 也 可 以 
访问 外 部 类 的 所 有 变量 和 方法 ， 可 以 访问 方法 中 的 fnal 参 数 和 局 部 变 


里 


匿名 内 部 类 是 怎么 实现 的 呢 ? 每 个 匿名 内 部 类 也 都 被 生成 为 一 个 
独立 的 类 ， 只 是 类 的 名 字 以 外 部 类 加 数字 编号 ， 没 有 有 意义 的 名 字 。 
A 
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代码 清单 5-11 匿名 内 部 类 示例 的 内 部 实现 


public class Outer { 
public void test(final int x, final int y)t{ 
Point p = new Outer$1(this,2,3,x,y); 
System.out.println(p.distance( )); 
} 


public class Outer$1 extends Point { 

int x2; 

int y2; 

Outer outer; 

Outer$1(Outer outer, int x1, int yi1, int x2, int y2){ 
super (x1, y1); 
this.outer = outer,; 
this.x2 = x2; 
this.y2 = y2,; 


QOverride 
public double distance() { 
return distance(new Point(this.x2,y2)); 


与 方法 内 部 类 类 似 ， 外 部 实例 this、 方 法 参数 x 和 y 都 作为 参数 传递 
给 了 内 部 类 构造 方法 。 此 外 ，new 时 的 参数 2 和 3 也 传递 给 了 构造 方 
法 ， 内 部 类 构造 方法 又 将 它们 传递 给 了 父 类 构造 方法 。 


匿名 内 部 类 能 做 的 ， 方 法 内 部 类 都 能 做 。 但 如 条 对 象 只 会 创建 一 
次 ， 且 不 需要 构造 方法 来 接受 参数 ， 则 可 以 使 用 匿名 内 部 类 ， 这 样 代 
码 书写 上 更 为 简洁 。 


在 调用 方法 时 ， 很 多 方法 需要 一 个 接口 参数 ， 比 如 Arrays.sort 方 
法 ， 它 可 以 接受 一 个 数组 ， 以 及 一 个 Comparator 接 口 参 数 ， 
Comparator 有 一 个 方法 compare 用 于 比较 两 个 对 象 。 比 如 ， 要 对 一 个 字 
竺 串 数 组 不 区 分 大 小 写 排 序 ， 可 以 使 用 Arrays.sort 方 法 ， 但 需要 传递 一 
人 
0 个 \: 


public void sortIgnoreCase(String[] strs){ 
Arrays.sort(strs, new Comparator<String>() { 
Q@Override 
public int compare(String o1, String 02) { 
return o1.compareToIgnoreCase(o2); 


}); 


Comparator 后 面 的 <String> 与 泛 型 有 关 ， 表 示 比 较 的 对 象 是 字符 串 
类 型 。 匿 名 内 部 类 还 经 常用 于 事件 处 理 程序 中 ， 用 于 响应 某 个 事件 ， 
比如 一 个 Button， 处 理 单 击 事件 的 代码 可 能 类 似 如 下 : 


Button bt = new Button(); 
bt.addActionListener(new ActionListener(){ 
QOverride 
public void actionPerformed(ActionEvent e) { 
圳 件 


// 处 理事 人 


调用 addActionListener 将 事件 处 理 程 序 注 册 到 了 Button 对 象 bt 中 ， 
当 事 件 发 生 时 ， 会 调用 actionPerformed 方 法 ， 并 传递 事件 详情 
ActionEvent 作 为 参数 。 


以 上 Arrays.sort 和 Button 都 是 针对 接口 编程 的 例子 ， 男 外 ， 它 们 也 
都 是 一 种 回调 的 例子 。 所 谓 回调 是 相对 于 一 般 的 正 癌 调用 而 言 的 ， 平 
时 一 般 都 是 正 回调 用 ， 但 Arrays.sort 中 传递 的 Comparator 对 象 ， 它 的 
compare 方 法 并 不 是 在 写 代码 的 时 候 被 调用 的 ， 而 是 在 Arrays.sort 的 内 
部 某 个 地 方 回 过 头 来 调用 的 。Button 的 addActionListener 中 传递 的 
ActionListener 对 象 ， 它 的 actionPerformed 方 法 也 一 样 ， 是 在 事件 发 生 
的 时 候 回 过 头 来 调用 的 。 


将 程序 分 为 伯 持 不 变 的 主体 框架 ， 和 针对 具体 情况 的 可 变 逻 辑 ， 
通过 回调 的 方式 进行 协作 ， 有 是 计算 机 程序 的 一 种 利用 实践 。 匿 名 内 部 
类 是 实现 回调 接口 的 一 种 简便 方 式 。 

至 此 ， 关 于 各 种 内 部 类 束 介 绍 完了 。 内 部 类 本 质 上 部 会 被 转换 为 


下 立 的 类 ， 但 一 般 而 言 ， 它 们 可 以 实现 更 好 的 封闭， 代码 实现 上 也 更 
为 简洁 。 


5.4 枚 举 的 本 质 


本 节 探 讨 Java 中 的 枚 举 类 型 。 枚 举 十 一 种 特殊 的 数据 ， 它 的 取 值 
是 有 限 的 ， 是 可 以 枚 举 出 来 的 ， 比 如 一 年 有 四 季 、 一 周 有 七 天 。 虽 然 
使 用 类 也 可 以 处 理 这 种 数据 ， 但 枚 举 类 型 更 为 简洁 、 安 全 和 方便 。 下 


lk 和 实现 原理 。 先 介绍 基础 用 法 和 原理 ， 再 介绍 典型 
尿 ° 
5.4.1 基础 


定义 和 使 用 基本 的 枚 举 是 比较 简单 的 ， 我 们 来 看 个 例子 。 为 表示 
J 国人 二 个 二 
， 代 人 码 如 下 : 


public enum Size 
SMALL, MEDIUM, LARGE 
} 


枚 举 使 用 enum 这 个 关键 字 来 定义 ，Size 包 括 三 个 值 ， 分 别 表 示 
小 、 中 、 大 ， 值 一 般 是 大 写 的 字母 ， 多 个 值 之 间 以 返 号 分 隔 。 枚 举 类 
型 可 以 定义 为 一 个 单独 的 文件 ， 也 可 以 定义 在 其 他 类 内 部 。 


可 以 这 样 使 用 Size: 


Size size = Size.MEDIUM 


Size size 声 明了 一 个 变量 size， 它 的 类 型 是 Size， 
size=Size.MEDIUM 将 枚 举 值 MEDIUM 赋 值 给 Size 变量 。 枚 举 变量 的 
toString 方 法 返回 其 字面 值 ， 所 有 枚 举 类 型 也 都 有 一 个 name () 方法 ， 
返回 值 与 toString () 一 样 ， 例 如 : 


Size size = Size.SMALL， 
System,.out,println(Size.toString() )， 
System.out.println(size.name()); 


输出 都 症 SMALL。 枚 举 变 量 可 以 使 用 equals 和 == 进 行 比 较 ， 结 采 
征 一 样 的 ， 例 如 : 


Size size = Size.SMALL， 
System.out.println(size==Size.SMALL); 
System.out.println(size.equals(Size.SMALL)); 
System.out.println(size==Size.MEDIUM); 


上 面 代码 的 输出 结果 为 三 行 ， 分 别 是 true、true、false。 枚 举 值 是 
有 顺序 的 ， 可 以 比较 大 小 。 枚 举 类 型 都 有 一 个 方法 int ordinal () ， 表 
示 枚 举 值 在 声明 时 的 顺序 ， 从 0 开始 ， 例 如 ， 如 下 代码 输出 为 1: 


Size size = Size.MEDIUM; 
System.out.println(size.ordinal()); 


另外 ， 枚 举 类 型 都 实现 了 Java API 中 的 Comparable 接 口 ， 都 可 以 通 
过 方法 compareTo 与 其 他 枚 举 值 进行 比较 。 比 较 其 实 束 是 比较 ordinal 的 
大 小 ， 例 如 ， 如 下 代码 输出 为 -1， 表 示 SMALL 小 于 MEDIUM: 


Size size = Size.SMALL,; 
System.out.println(size.compareTo(Size.MEDIUNM)); 


枚 举 变 量 可 以 用 于 和 其 他 类 型 变量 一 样 的 地 方 ， 如 方法 参数 、 类 
变量 、 实 例 变 量 等 。 枚 举 还 可 以 用 于 switch 语 句 ， 代 码 如 下 所 示 : 


人 | 


static void onChosen(Size Size){ 
Switch(Size){ 
case SMALL : 
System,.out,println("chosen small"); break; 
case MEDIUM : 
System.out,println("chosen medium"); break 
case LARGE: 
System.out.println("chosen large"); break; 
} 
} 


在 switch 语 句 内 部 ， 枚 举 值 不 能 囊 枚 举 类 型 前 级 ， 例 如 ， 直 接 使 
用 SMALL ， 不 能 使 用 Size.SMALL。 枚 举 类 型 都 有 一 个 静态 的 valueOf 
a 方法 ， 可 以 返回 字符 串 对 应 的 枚 举 值 ， 例 如 ， 以 下 代码 输出 
yJtrue : 


System,.out,println(Size.SMALL==Size.Valueof("SMALL") ) ， 


枚 举 类 型 也 都 有 一 个 静态 的 values 方 法 ， 返 回 一 个 包括 所 有 枚 举 
值 的 数组 ， 顺 序 与 声明 时 的 顺序 一 致 ， 例 如 : 


for(Size Size : Size.values())t{ 
System.out.println(size),; 
} 


屏幕 输出 为 三 行 ， 分 别 是 SMALL 、MEDIUM 、LARGE。 


Java 是 从 Java 5 才 开 始 支 持 枚 举 的 ， 在 此 之 前 ， 一般 是 在 类 中 定义 
静态 整 型 变量 来 实现 类 似 功能 ， 代 码 如 下 所 示 : 


class Size { 
public static final int SMALL = 0; 
public static final int MEDIUM = 1; 
public static final int LARGE = 2; 
} 


枚 举 的 好 处 体现 在 以 下 几 方 面 。 
定义 枚 举 的 语法 更 为 简洁 。 


枚 举 更 为 安全 。 一 个 枚 举 类 型 的 变量 ， 它 的 值 要 人 么 为 null， 要 人 么 
为 枚 举 值 之 一 ， 不 可 能 为 其 他 值 ， 但 使 用 整 型 变量 ， 它 的 值 吏 没有 办 
法 强制 ， 值 可 能 吏 是 无 效 的 。 


- 枚 举 类 型 自 带 很 多 便利 方法 (如 values、valueOf、toString 等 ) ， 
易于 使 用 。 


枚 举 是 怎么 实现 的 呢 ? 枚 举 类 型 实际 上 会 被 Java 编 译 央 转换 为 一 
个 对 应 的 类 ， 这 个 类 继承 了 Java API 中 的 java.lang.Enum 类 。Enum 类 有 
name 和 ordinal 两 个 实例 变量 ， 在 构造 方法 中 需要 传递 ，name () 、 
toString () 、ordinal () 、compareTo () 、equals () 方法 都 是 由 
Enum 类 根据 其 实例 变量 name 和 ordinal 实 现 的 。values 和 valueOf 方 法 是 
编译 絮 给 每 个 枚 举 类 型 自动 添加 的 ， 上 面 的 枚 举 类 型 size 转 换 成 的 普 


通关 的 代码 大 概 如 代码 清单 5-12 所 示 。 和 需要 说 明 的 是 ， 这 只 是 示意 代 
码 ， 不 能 直接 运行 。 


代码 清单 5-12 ” 枚 举 类 Size 对 应 的 普通 类 示意 代码 


public final class Size extends Enum<Size> { 
public static final Size SMALL = new Size("SMALL",0); 
public static final Size MEDIUM = new Size("MEDIUM",1); 
public static final Size LARGE = new Size("LARGE",2); 
private static Size[] VALUES = new Size[ |]{SMALL,MEDIUM, LARGE}; 
private Size(String name, int ordinal)t{ 
super(name, ordinal); 


public static Size[] values(){ 
Size[] values = new Size[VALUES.1length]; 
System.arraycopy(VALUES, 090, values, 0, VALUES.1length); 
return values; 


public static Size Valueof(String name ){ 
return Enum.Valueof(Size,class，name ) ， 
} 


} 


解释 几 点 : 


1) Size 是 final 的 ， 不 能 被 继承 ，Enum<Size> 表 示 父 类 ，<Size> 是 
汉 型 写法 ; 


2) Size 有 一 个 私有 的 构造 方法 ， 接 受 name 和 ordinal， 传 递 给 父 
类 ， 私 有 表示 不 能 在 外 部 创建 新 的 实例 ; 


3) 三 个 枚 举 值 实际 上 是 三 个 静态 变量 ， 也 是 final 的 ， 不 能 被 修 


改 ; 


4) values 方 法 是 编译 器 添加 的 ， 内 部 有 一 个 values 数 组 保持 所 有 
枚 举 值 ; 


5) valueOf 方 法 调用 的 是 父 类 的 方法 ， 额 外 传递 了 参数 
Size.class， 表 示 类 的 类 型 信息 ， 关 于 类 型 信息 的 详细 介绍 在 第 21 章 ， 
ee 根据 name 对 比 得 到 对 应 的 枚 
举 值 的 。 


一 般 枚 举 变 量 会 被 转换 为 对 应 的 类 变量 ， 在 switch 语 名 中， 枚 举 
值 会 被 转换 为 其 对 应 的 ordinal 值 。 可 以 看 出 ， 枚 举 类 型 本 质 上 也 是 


人 了 很 多 事情 ， 因 此 它 的 使 用 更 为 简洁 、 安 全 
0 o 


5.4.2” 上 典型 场景 


以 上 枚 举 用 法 是 最 简单 的 ， 实 际 中 枚 举 经 常会 有 关联 的 实例 变量 
和 方法 。 比 如 ， 上 面 的 Size 例 和子， 每 个 枚 举 值 可 能 有 关联 的 缩写 和 中 
文 名 称 ， 可 能 需要 静态 方法 根据 缩写 返回 对 应 的 枚 举 值 ， 修 改 后 的 
Size 代 码 如 代码 清单 5-13 所 示 。 


代码 清单 5-13” 珊 有 实例 变量 和 方法 的 枚 举 类 Size 


public enum Size { 

SMALL( ve "小 号 ")， 

MEDIUM("M", "中 号 ")， 

LARGE( We "大 号 ")，; 

private String abbr; 

private String title,; 

private Size(String abbr, String title){ 
this.abbr = abbr; 
this,.title = title,; 


} 
public String getAbbr() { 
return abbr; 


} 
public String getTitle() { 
return title,; 


} 
public static Size fromAbbr(String abbr){ 
for(Size size : Size.values())t{ 
if(size.getAbbr().equals(abbr)){ 
return size; 


} 
return null; 
} 
} 


上 述 代码 定义 了 两 个 实例 变量 abbr 和 title， 以 及 对 应 的 get 方 法 ， 
分 别 表示 缩写 和 中 文 名 称 ; 定义 了 一 个 私有 构造 方法 ， 接 受 缩写 和 中 
文 名 称 ， 每 个 枚 举 值 在 定义 的 时 候 都 传递 了 对 应 的 值 ， 同 时 定义 了 一 
个 静态 方法 fromAbbr， 根 据 缩写 返回 对 应 的 枚 举 值 。 需 要 说 明 的 是 ， 
枚 举 值 的 定义 需要 放 在 最 上 面 ， 枚 举 值 写 完 之 后 ， 要 以 分 号 (; ) 结 
尾 ， 然 后 才能 写 其 他 代码 。 


这 个 枚 举 定 义 的 使 用 与 其 他 类 类 似 ， 比 如 : 


Size s = Size.MEDIUM,; 

System.out.println(s.getAbbr()); // 输 出 M 
s = Size.fromAbbr("L"); 
System.out.println(s.getTitle()); // 输 出 “大 号 ” 


加 了 实例 变量 和 方法 后 ， 枚 举 转换 后 的 类 与 代码 清单 5-12 类 似 ， 
只 是 增加 了 对 应 的 变量 和 方法 ， 修 改 了 构造 方法 ， 代 码 不 同 之 处 大 概 
如 代码 清单 5-14 所 示 。 


代码 清单 5-14 增加 了 实例 变量 和 方法 后 的 枚 举 类 Size 对 应 的 普 
通 类 示意 代码 


public final class Size extends Enum<Size> { 
public static final Size SMALL = new Size("SMALL",O0, 2 "小 号 ")， 
public static final Size MEDIUM. = New Size( 'MEDIUM" 1 "M", "中 号 "); 
public static final Size LARGE = new Size("LARGE" ,2, 2 ,大 号 中 | 
private String abbr; 
private String title,; 
private Size(String name, int ordinal，String abbr，String title){ 
Super(name，ordinal) ， 
this.abbr = abbr; 
this,.title = title,; 


// 其 他 代码 


每 个 枚 举 值 经 常 有 一 个 关联 的 标识 符 (id) ， 通 常用 int 整 数 表 
示 ， 使 用 整数 可 以 地 约 存储 空间 ， 减 少 网络 传 输 。 一 个 目 然 的 想法 是 
使 用 枚 举 中 目 带 的 ordinal 值 ， 但 ordinal 值 并 不 是 一 个 好 的 选择 。 为 什 
么 呢 ? 因为 ordinal 值 会 随 着 枚 举 值 在 定义 中 的 位 置 变化 而 变化 ， 但 一 
般 来 说 ， 我 们 和 希望 id 值 和 枚 举 值 的 关系 保持 不 变 ， 尤 其 是 表示 枚 举 值 
的 id 已 经 保存 在 了 很 多 地 方 的 时 候 。 比 如 ， 上 面 的 Size 例 子 ， 
Size.SMALL 的 ordinal 值 为 0， 我 们 和 希望 0 表示 的 就 是 Size.SMALL ， 但 
如 果 增 加 一 个 表示 超 小 的 值 XSMALL: 


public enum Size { 
XSMALL， SMALL， MEDIUM， LARGE 
} 


” ”这 时 ，0 束 表示 XSMALL 了。 所 以 ， 一般 是 增加 一 个 实例 变量 表 
示 id。 使 用 实例 变量 的 男 一 个 好 处 是 ，id 可 以 目 己 定义 。 比 如 ，Size 例 
子 可 以 写 为 : 


public enum Size { 
XSMALL(10), SMALL(20), MEDIUM(30), LARGE(40); 
private int id; 
private Size(int id)f{ 
this,id = id; 


} 
public int getId() { 
return id; 
} 
} 


枚 举 还 有 一 些 高 级 用 法 ， 比 如 ， 每 个 枚 举 值 可 以 有 关联 的 类 定义 
体 ， 枚 举 类 型 可 以 声明 抽象 方法 ， 每 个 枚 举 值 中 可 以 实现 该 方法 ， 也 
可 以 重 写 枚 举 类 型 的 其 他 方法 。 此 外 ， 枚 举 可 以 实现 接口 ， 也 可 以 在 
接口 中 定义 枚 举 ， 其 使 用 相对 较 少 ， 我 们 束 不 介绍 了 。 


至 此 ， 天 于 枚 举 ， 我 们 束 介 绍 完了 ， 对 于 枚 举 类 型 的 数据 ， 虽 然 
直接 使 用 类 也 可 以 处 理 ， 但 枚 举 类 型 更 为 简洁 、 安 全 和 方便 。 


本 章 介绍 了 类 的 一 些 扩展 概念 ， 包 括 接口 、 抽 象 类 、 内 部 类 和 枚 
举 。 我 们 之 前 提 到 过 异常 ， 但 并 未 深入 讨论 ， 让 我 们 下 一 章 来 探讨 。 


第 6 章 ” 异 币 


之 前 我 们 介绍 的 基本 类 型 、 类 、 接 口 、 枚 举 都 是 在 表示 和 操作 数 
据 ， 操 作 的 过 程 中 可 能 有 很 多 出 错 的 情况 ， 出 错 的 原因 可 能 是 多 方面 
的 ， 有 的 是 不 可 控 的 内 部 原因 ， 比 如 内 存 不 够 了 、 和 磁盘 满 了 ， 有 的 是 
不 可 欣 的 外 部 原因 ， 比 如 网 络 连 接 有 问题 ， 更 多 的 可 能 是 程序 的 编写 
错误 ， 比 如 引用 变量 未 初始 化 就 直接 调用 实例 方法 。 

这 些 非 正 常情 况 在 Java 中 统一 被 认为 是 异常 ，Java 使 用 异常 机 制 
来 统一 处 理 。 本 章 束 来 详细 讨论 Java 中 的 异常 机 制 ， 首 先 介 绍 腊 党 的 
初步 概念 ， 以 及 异常 类 本 喘 ， 然 后 主要 介绍 异常 的 处 理 。 


y 


6.1 初 识 异 党 


我 们 先 来 看 两 个 具体 的 异常 : NullPointerException 和 
NumberFormatException ° 


6.1.1 NullPointerException ( 空 指针 异常 ) 
我 们 来 看 段 代码 : 


public class ExceptionTest { 
public static void main(String[] args) { 
String s = null; 
s.indexof ("a"); 
System.out.println("end"); 
} 
} 


变量 s 没 有 初始 化 束 调 用 其 实例 方法 indexOf， 运 行 ， 屏 幕 输出 


Exception in thread "main" java.lang.NullPpointerException 
at ExceptionTest.main(ExceptionTest.java:5) 


输出 是 告诉 我 们 : 在 ExceptionTest 类 的 main 函 数 中 ， 代 码 第 5 行 ， 
出 现 了 空 指针 异常 (java.lang.NullPointerException) 。 


但 ， 具 体 发 生 了 什么 呢 ? 当 执行 s.indexOf ("a") 的 时 候 ，Java 虚 
拟 机 发 现 s 的 值 为 ul， 没有 办 法 继续 执行 了 ， 这 时 束 启 用 异常 处 理 机 
制 ， 首 先 创 建 一 个 异常 对 象 ， 这 里 是 类 NullPointerException 的 对 象 ， 
然后 查找 看 谁 能 处 理 这 个 异常 ， 在 示例 代码 中 ， 没 有 代码 能 处 理 这 个 
a 即 打印 异常 栈 信息 到 屏幕 ， 并 退 
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在 介绍 函数 调用 原理 的 时 候 ， 我 们 介绍 过 栈 ， 异 币 栈 信息 天 包括 
了 从 异 前 发 生 点 到 最 上 层 调用 者 的 轨迹 ， 还 包括 行 号 ， 可 以 说 ， 这 个 
栈 信息 是 分 析 异 前 最 为 重要 的 信息 。 


Java 的 默认 异常 处 理 机 制 是 退出 程序 ， 异 常 发 生 点 后 的 代码 都 不 
会 执行 ， 所 以 示例 代码 中 的 System.out.println ("end") 不 会 执行 。 


6.1.2 NumberFormatException (数字 格式 异常 ) 


我 们 再 来 看 一 个 例子 ， 代 码 如 下 : 


public class ExceptionTest { 
public static void main(String[] args) { 
if(args.length<1){ 
System.out .println(" 请 输入 数字 ")， 
return; 


int num = Integer.parseInt(args[0]); 
System.out.println(num); 


args 表 未 命令 行 参数 ， 这 上 段 代码 要 求 参数 为 一 个 数 子 ， 它 通过 
Integer.parseInt 将 参数 转换 为 一 个 整数 ， 并 输出 这 个 整数 。 参 数 是 用 户 
输入 的 ， 我 们 没有 办 法 强制 用 户 输入 什么 ， 如 采用 户 输入 的 古 数字 ， 
比如 123， 拼 幕 会 输出 123， 但 如 采用 户 输 的 不 古 数 字 而 是 字母 ， 比 如 
abc， 屏 间 会 输出 : 


Exception in thread "main" java.lang.NumberFormatException: For input string: 
"rabc" 

at 
java.1lang.NumberFormatException.forIinputString(NumberFormatException.java:65) 

at java.lang.Integer.parseInt(Integer.java:492) 

at java.lang.Integer.parseInt(Integer.java:527) 

at ExceptionTest.main(ExceptionTest.java:7) 


出 现 了 异常 NumberFormatException。 这 个 异常 是 怎么 产生 的 呢 ? 
根据 异常 栈 信息 ， 我 们 看 相关 代码 。NumberFormatException 类 65 行 附 
近代 码 如 下 : 


64 static NumberFormatException forInputString(String s) { 
65 return new NumberFormatException("For input string: \" "+ S+ "\""),; 
66 } 


Integer 类 492 行 附近 代码 如 下 : 


490 digit = Character.digit(s.charAt(i++),radix); 
491 if (digit < 0) 


492 throw NumberFormatEXxception.forInputString(s)， 
493 } 

494 if (result < multmin) 

495 throw NumberFormatEXxception.forInputString(s)， 
496 } 


将 这 两 处 合 为 一 行 ， 主 要 代码 就 是 : 
throw new NumberFormatException(...) 


new NumberFormatException 是 容易 理解 的 ， 含 义 是 创建 了 一 个 类 
的 对 象 ， 只 是 这 个 类 是 一 个 异常 类 。throw 是 什么 意思 呢 ? 就 是 抛 出 异 
常 ， 它 会 触发 Java 的 异常 处 理 机 制 。 在 之 前 的 空 指针 异常 中 ， 我 们 没 
有 看 到 throw 的 代码 ， 可 以 认为 throw 是 由 Java 虚 拟 机 自己 实现 的 。 


throw 关 键 字 可 以 与 returmm 关 键 字 进行 对 比 。return 代 表 正 常 退 出 ， 
throw 代 表 异 常 退 出 ; return 的 返回 位 置 是 确定 的 ， 束 是 上 一 级 调用 
本 ， 而 throw 后 执行 哪 行 代 码 则 经 常 古 不 确定 的 ， 由 异常 处 理 机 制 动 态 
确定 。 


异常 处 理 机 制 会 从 当前 函数 开始 查找 看 谁 “ 捕 获 ” 了 这 个 异常 ， 当 
前 函数 没有 就 查看 上 一 层 ， 直 到 主 函 数 ， 如 果 主 函数 也 没有 ， 束 使 用 
0 即 输出 异常 栈 信息 并 退出 ， 这 正 古 我 们 在 屏幕 输出 中 看 到 


对 于 屏幕 输出 中 的 异常 栈 信息 ， 程 序 员 是 可 以 理解 的 ， 但 普通 用 
户 无 法 理解 ， 也 不 知道 该 怎么 办 ， 我 们 需要 给 用 户 一 个 更 为 友好 的 信 
息 ， 告 诉 用 户 ， 他 应 该 输入 的 是 数字 ， 要 做 到 这 一 点 ， 需 要 自己 “ 捕 
获 "异常 。“ 捕 获 " 是 指使 用 try/catch 关 键 字 ， 如 代码 清单 6-1 所 示 。 


代码 清单 6-1 ”捕获 异常 示例 代码 


public class ExceptionTest { 
public static void main(String[] args) { 
if(args.length<1){ 
System,.out ,println(" 请 输入 数字 " ) ; 
return 


} 
try{ 


int num = Integer.parseInt(args[0]); 
System.out,println(Cnum) ， 
}catch(NumberFormatException e){ 
System,err.println(" 参 数 " + args[9] + "不 是 有 效 的 数字 ， 请 输入 数字 " ) ; 


上 还 代码 使 用 try/catch 捕 获 并 处 理 了 异常 ，try 后 面 的 花 括号 {内 
包含 可 能 抛 出 异常 的 代码 ， 括 号 后 的 catch 语 句 包 含 能 捕获 的 异常 和 处 
理 代码 ，catch 后 面 括号 内 是 异常 信息 ， 包 括 异常 类 型 和 变量 名 ， 这 里 
是 NumberFormatException e， 通 过 它 可 以 获取 更 多 异常 信息 ， 兹 括号 
{} 内 是 处 理 代码 ， 这 里 输出 了 一 个 更 为 友好 的 提示 信息 。 


捕获 异 遂 后， 程序 承 不 会 异 币 退出 了 ， 但 try 语 句 内 有 异 利 点 之 后 的 
其 他 代码 就 不 会 执行 了 ， 执 行 完 catch 内 的 语句 后 ， 程 序 会 继续 执行 
catch 化 括号 外 的 代码 。 


至 此 ， 我 们 就 对 异常 有 了 一 个 初步 的 了 解 。 异 常 是 相对 于 return 的 
一 种 退出 机 制 ， 可 以 由 系统 触发 ， 也 可 以 由 程序 通过 throw 语 句 触 发 ， 
异常 可 以 通过 try/catch 语 句 进 行 捕获 并 人 处理 ， 如 果 没 有 捕获 ， 则 会 导致 
i °。 异常 有 不 同 的 类 型 ， 接 下 来 ， 我 们 来 认 
TAN 呈 


6.2 异常 类 


NullPointerException 和 NumberFormatException 都 是 异常 类 ， 所 有 
异常 类 都 有 一 个 共同 的 父 类 Throwable， 我 们 先 来 介绍 这 个 父 类 ， 然 后 
介绍 Java 中 的 异常 类 体系 ， 最 后 介绍 怎么 日 定义 异常 。 


6.2.1 Throwable 


NullPointerException 和 NumberFormatException 有 一 个 共同 的 父 类 
Throwable， 它 有 4 个 public 构 造 方法 : 


public Throwable() 

public Throwable(String message) 

public Throwable(String message, Throwable cause) 
public Throwable(Throwable cause) 


OD 


Throwable 类 有 两 个 主要 参数 : 一 个 是 message， 表 示 异 常 消息 ; 男 
一 个 是 cause ， 表 示人 触发 该 异常 的 其 他 异常 。 异 常 可 以 形成 一 个 异常 
链 ， 上 层 的 异常 由 撒 层 异 销 触 发 ，cause 表 示 撒 层 异 销 。Throwable 还 有 
一 个 public 方 法 用 于 设置 cause: 


Throwable initCause(Throwable cause) 


Throwable 的 某 些 子 类 没有 带 cause 参 数 的 构造 方法 ， 就 可 以 通过 这 
个 方法 来 设置 ， 这 个 方法 最 多 只 能 被 调用 一 次 。 在 所 有 构造 方法 的 内 
部 ， 都 有 一 句 重 要 的 函 效 调用 : 


fillIinstackTrace( ); 


它 会 将 异 剃 栈 信息 保存 下 来 ， 这 是 我 们 能 看 到 异 营 栈 的 关键 。 
Throwable 有 一 些 单 用 方法 用 于 获取 有 异 音 信息， 比如 : 


void printStackTrace() // 打 印 异 常 栈 信息 到 标准 错误 输出 流 
// 打 印 栈 信息 到 指定 的 流 ，PrintStream 和 Printwriter 在 第 13 章 介绍 


void printStackTrace(PrintStream s) 

void printStackTrace(Printwriter s) 

String getMessage() // 获 取 设置 的 异常 nessage 

Throwable getCause() // 获 取 异 常 的 cause 

// 获 取 异 常 栈 每 一 层 的 信息 ， 每 个 SttackTraceElement 包 括 文件 名 、 类 名 、 画 数 名 、 行 号 等 信息 
StackTraceElement[] getStackTrace() 


6.2.2 ”异常 类 体系 


以 Throwable 为 根 ，Java 定 义 了 非常 多 的 异常 类 ， 表 示 各 种 类 型 的 
异常 ， 部 分 类 如 图 6-1 所 示 。 


Throwable 


RuntimeException 


IOException 


IIIegalStateException 
ClassCastException 


IJIegalArgumentException 


NumberFormatException 


图 6-1 Java 异 常 类 体系 
Throwable 是 所 有 异常 的 基 类 ， 它 有 两 个 子 类 : Error 和 Exception 。 


Error 表 示 系 统 错误 或 资源 耗 尽 ， 由 Java 系 统 自 己 使 用 ， 应 用 程序 
不 应 抛 出 和 处 理 ， 比 如 图 6-1 中 列 出 的 虚拟 机 错误 
(VirtualMacheError) 及 其 子 类 内 存 溢出 错误 (OutOfMemory-Error) 
和 栈 洲 出 错误 (StackOverflowError) 。 


Exception 表 示 应 用 程序 错误 ， 它 有 很 多 子 类 ， 应 用 程序 也 可 以 通 
过 继承 Exception 或 其 子 类 创建 自 定义 异常 ， 图 6-1 中 列 出 了 三 个 直接 子 
类 :IOException (输入 输出 W/O 异 常 、RuntimeException (运行 时 异 
常 ) 、SQLException (数据 库 SQL 异 常 ) 。 


SQLException 


NullPointerException 
IndexOutOfBoundsException 
StringIndexOutOfBoundsException 


ArrayIndexOutOfBoundsException 


Virtual MachineError 


OutOfMemoryError 


StackOverflowError 


RuntimeException 比 较 特 殊 ， 它 的 名 字 有 点 误导 ， 因 为 其 他 异常 也 
是 运行 时 产生 的 ， 它 表示 的 实际 含义 是 末 受 检 异 肖 (unchecked 
exception) ， 相 对 而 言 ，Exception 的 其 他 子 类 和 Exception 目 号 则 是 受 
全 异常 (checked exception) ，Error 及 其 子 类 也 是 未 受 检 异 常 。 


受 检 (checked) 和 未 受 检 unchecked) 的 区 别 在 于 Java 如 何 处 理 
这 两 种 异常 。 对 于 受 检 异 常 ，Java 会 强制 要 求 程序 员 进 行 处 理 ， 否 则 会 
有 编译 错误 ， 而 对 于 未 受 检 异常 则 没有 这 个 要 求 。 下 文 我 们 会 进一步 
解释 。 

RuntimeException 也 有 很 多 子 类 ， 表 6-1 列 出 了 其 中 常见 的 一 些 。 


表 6-1 常见 的 RuntimeException 


异 常 说 明 
NullPointerException 空 指针 异常 NumberFormatException 数字 格式 错误 
IllegalStateException 韭 法 状态 IndexOutOfBoundsException 索引 越界 
ClassCastException 非法 强制 类 型 转换 ArrayIndexOutOfBoundsException | 数组 索引 越界 
IllegalAreumentException 参数 错误 StringIndexOutOfBoundsException | 字符 串 索 引 越 界 


如 此 多 不 同 的 异常 类 其 实 并 没有 比 Throwable 这 个 基 类 多 多 少 属 性 
和 方法 ， 大 部 分 类 在 继承 父 类 后 只 是 定义 了 几 个 构造 方法 ， 这 些 构造 
方法 也 只 是 调用 了 父 类 的 构造 方法 ， 并 没有 额外 的 操作 。 


那 为 什么 定义 这 么 多 不 同 的 类 呢 ? 主要 是 为 了 名 字 不 同 。 异 常 类 
的 名 子 本 里 整 代 表 了 异 第 的 天 键 信息 ， 无 论 古 抛 出 还 是 捕获 异 征 ， 使 
用 合适 的 名 字 都 有 助 于 代码 的 可 读 性 和 可 维护 性 。 


6.2.3 目 定 义 异 常 


除了 Java API 中 定义 的 异常 类 ， 也 可 以 目 己 定义 异常 类 ， 一 般 是 继 
承 Exception 或 者 它 的 某 个 子 类 。 如 果 父 类 是 RuntimeException 或 它 的 某 
个 子 类 ， 则 目 定义 异常 也 是 未 受 检 异常 ， 如 果 是 Exception 或 Exception 
的 其 他 子 类 ， 则 目 定 义 异 常 是 受 检 异 常 。 


我 们 通过 继承 Exception 来 定义 一 个 异 第 ， 如 代码 清单 6-2 所 示 。 


代码 清单 6-2” 目 定义 异 第 示例 


public class AppException extends Exception f{ 
public AppException() { 
super(); 


public AppException(String message, Throwable cause) { 
super(message, cause); 


} 
public AppException(String message) { 
super (message); 


} 
public AppException(Throwable cause) { 
super (cause); 


和 很 多 其 他 异 单 类 一 样 ， 我 们 没有 定义 额外 的 属性 和 代码 ， 只 走 
继承 了 Exception， 定 义 了 构造 方法 并 调用 了 父 类 的 构造 方法 。 


6.3” 异 销 处 理 


在 了 解 了 异常 的 基本 概念 和 异常 类 之 后 ， 我 们 来 看 Java 语 言 对 寞 
党 处 理 的 支持 ， 包 括 catch 、throw 、finally 、try-with-resources 和 
throws， 最 后 对 比 受 检 和 未 受 检 异 常 。 


6.3.1 。 catch 匹配 
在 代码 清单 6-1 中 ， 我 们 简单 演示 了 使 用 try/catch 捕 获 异 常 ， 其 中 


catch 只 有 一 条 ， 其 实 ，catch 还 可 以 有 多 条 ， 每 条 对 应 一 种 异常 类 型 。 


示例 如 下 面 代码 所 示 : 


try{ 
// 可 能 触发 异常 的 代码 
}catch(NumberFormatException e){ 

System,out,println("not valid number"); 
}catch(RuntimeException e){ 

System.out.println("runtime exception "+e.getMessage()); 
}catch(Exception e){ 

e.printStackTrace( ); 


异 角 处 理 机 制 将 根据 抛 出 的 异常 类 型 找 第 一 个 匹配 的 catch 块 ， 找 
到 后 ， 执 行 catch 块 内 的 代码 ， 不 再 执行 其 他 catch 块 ， 如 条 没有 找到 ， 
会 继续 到 上 层 方 法 中 查找 。 需 要 注意 的 是 ， 抛 出 的 异 贡 类 型 是 catch 中 
声明 异 和 贡 的 子 类 也 算 匹 配 ， 所 以 需要 将 最 具体 的 子 类 放 在 前 面 ， 如 采 
基 类 Exception 放 在 前 面 ， 则 其 他 更 具体 的 catch 代 码 将 得 不 到 执行 。 


上 述 示 例 也 演示 了 对 异常 信息 的 利用 ，e.getMessage () 获取 异常 
消息 ，e.printStackTrace () 打印 异常 栈 到 标准 错误 输出 流 。 这 些 信息 
有 助 于 理解 为 什么 会 出 现 异 党 ， 这 是 解决 编程 错误 的 常用 方法 。 示 例 
0 出 到 标准 流 上 ， 实 际 系统 中 更 常用 的 做 法 是 输出 到 专 
| 人 ® 


在 示例 中 ， 每 种 异常 类 型 都 有 单独 的 catch 语 句 ， 如 果 多 种 异 第 处 
理 的 代码 和 是 类 似 的 ， 这 种 写法 比较 烦琐 。 目 Java 7 开始 文 持 一 种 新 的 语 
法 ， 多 个 异常 之 间 可 以 用 中 操作 符 ， 形 如 : 


try { 
// 可 能 抛 出 ExceptionA 和 ExceptionB 
} catch (ExceptionA | ExceptionB e) { 
e,printStackTrace( ); 


6.3.2 ”重新 抛 出 异常 


在 catch 块 内 处 理 完 后 ， 可 以 重 独 抛 出 异 解 ， 异 党 可 以 是 原来 的 ， 
也 可 以 是 新 建 的 ， 如 下 所 示 : 


try{ 
// 可 能 触发 异常 的 代码 
}catch(NumberFormatException e){ 
System,out,println("not valid number"),; 
throw new AppException(" 输 入 格式 不 正确 "，e) ; 
}catch(Exception e){ 
e.printStackTrace( ); 
throw e; 


} 


对 于 Exception， 在 打印 出 异常 栈 后 ， 丈 通过 throw e 重 新 抛 出 了 。 


而 对 于 NumberFormatException ， 重新 抛 出 了 一 个 AppException ， 
当前 Exception 作 为 cause 传 递 给 这 样 就 形成 了 一 个 异 
常 链 ， 捕 获 到 AppException 的 代码 可 以 通过 getCause () 得 到 


NumberFormatException ° 


为 什么 要 重新 抛 出 呢 ? 因为 当前 代码 不 能 够 完全 处 理 该 异常 ， 需 
要 调用 者 进一步 处 理 。 


氏 什 么 要 抛 出 一 个 新 的 异常 蛇 % 当然 是 因为 当前 异常 不 太 合 适 
不 合适 可 能 是 信息 不 够 ， 需 要 补充 一 些 新 信息 ; 还 可 能 是 过 于 细 市 ， 
不 便于 调用 者 理解 和 使 用 ， 如 果 调 用 者 对 细节 感 兴趣 ， 还 可 以 继续 通 
过 getCause () 获取 到 原始 异常 。 


6.3.3 finally 


异常 机 制 中 还 有 一 个 重要 的 部 分 ， 就 是 finally。catch 后 面 可 以 跟 
finally 语 句 ， 语 法 如 下 所 示 : 


try{ 
// 可 能 抛 出 异常 
}catch(Exception e){ 
// 捕 获 异常 
}finally{ 
// 不 管 有 无 异常 都 执行 
} 


finally 内 的 代码 不 管 有 无 异常 发 生 ， 都 会 执行 ， 具 体 来 说 
.如 果 没 有 异常 发 生 ， 在 ty 内 的 代码 执行 结束 后 执行 。 


.如 果 有 异常 发 生 且 被 catch 捕 获 ， 在 catch 内 的 代码 执行 结束 后 执 
行 。 


-如 采 有 异常 发 生 但 没 被 捕获 ， 则 在 异常 被 抛 给 上 层 之 前 执行 。 
由 于 finally 的 这 个 特点 ， 它 一 般 用 于 释放 资源 ， 如 数据 库 连 接 、 
文件 流 等 。 


try/catchyfinally 语 法 中 ，catch 不 是 必需 的 ， 也 束 是 可 以 只 
try/finally, 表示 不 捕获 异常 ， 异 常 自动 向 上 传递 ， 但 finally 中 的 代码 
在 异常 发 生 后 也 执行 。 


finally 语 句 有 一 个 执行 细节 ， 如 有 果 在 try 或 者 catch 语 句 内 有 return 语 
句 ， 则 return 语 句 在 finally 语 句 执 行 结束 后 才 执 行 ， 但 finally 并 不 能 改 
变 返 回 值 ， 我 们 来 看 下 面 的 代码 : 


public static int test(){ 
int ret = 0 
try{ 
return ret 
}finally{ 
ret = 2; 


了 


这 个 函数 的 返回 值 是 0， 而 不 是 2。 实 际 执行 过 程 是 : 在 执行 到 try 
内 的 return ret; 语句 前 ， 会 移 将 返回 值 ret 保 存在 一 个 临时 变量 中 ， 然 
后 才 执 行 finally 语 句 ， 最 后 try 再 返回 那个 临时 变量 ，finally 中 对 ret 的 修 
改 不 会 被 返回 。 


如 果 在 finally 中 也 有 retum 语 句 呢 ? try 和 catch 内 的 retum 会 丢失 ， 
实际 会 返回 finally 中 的 返回 值 。finaly 中 有 return 不 仅 会 覆盖 try 和 catch 
中 返回 值 ， 还 会 掩盖 try 和 catch 内 的 异常 ， 束 像 异 常 没 有 发 生 一 样 ， 
比如 : 


public static int test(){ 
int ret = 0; 
try{ 
int a = 5/0; 
return ret,; 
}finally{ 
return 2; 
} 


} 


以 上 代码 中 ，5/0 会 触发 ArithmeticException， 但 是 finally 中 有 
return 语 句 ， 这 个 方法 就 会 返回 2， 而 不 再 同上 传递 异常 了 。finally 中 ， 
如 果 finally 中 抛 出 了 异常 ， 则 原 异 常 也 会 被 掩盖 ， 看 下 面 的 代码 : 


public static void test(){ 
try{ 
int a = 5/0 
}finally{ 
throw new RuntimeException("hello"); 
} 


} 


finally 中 抛 出 了 RuntimeException， 则 原 异 常 ArithmeticException 整 
丢失 了 。 所 以 ， 一般 而 言 ， 为 避免 混 消 ， 应 该 避免 在 finally 中 使 用 
return 语 句 或 者 抛 出 异常 ， 如 采 调 用 的 其 他 代码 可 能 抛 出 异常 ， 则 应 该 
捕获 异常 并 进行 处 理 。 


6.3.4 try-with-resources 


对 于 一 些 使 用 资源 的 场景 ， 比 如 文件 和 数据 库 连 接 ， 典 型 的 使 用 
流程 是 首先 打开 资源 ， 最 后 在 finally 语 句 中 调用 资源 的 关闭 方法 ， 针 
对 这 种 场景 ，Java 7 开始 支持 一 种 新 的 语法 ， 称 之 为 try-with- 
resources， 这 种 语法 针对 实现 了 java.lang.AutoCloseable 接 口 的 对 象 ， 
该 接口 的 定义 为 : 


public interface AutoCloseable { 
void close() throws Exception,; 


没有 try-with-resources 时 ， 使 用 形式 如 下 : 


public static void useResource() throws Exception { 
AutoCloseable r = new FileInputStream("hello"); // 创 建 资源 


// 使 用 资源 
} finally { 
r.close(); 


使 用 try-with-resources 语 法 ， 形 式 如 下 : 


public static void useResource( ) throws Exception { 
try(AutoCloseable r = new FileInputStream("hello")) { // 创 建 资源 
// 使 用 资源 


} 


资源 r 的 声明 和 初始 化 放 在 try 语 人 句 内 ， 不 用 再 调用 finally， 在 语句 
执行 完 try 语 句 后 ， 会 自动 调用 资源 的 close () 方法 。 


资源 可 以 定义 多 个 ， 以 分 号 分 阳 。 在 Java 9 之 前 ， 资 源 必须 声明 和 
初始 化 在 try 语 句 块 内 ，Java 9 去 除了 这 个 限制 ， 资 源 可 以 在 try 语 句 外 
被 声明 和 初始 化 ， 但 必须 是 final 的 或 者 是 事实 上 final 的 〈 即 虽然 没有 
声明 为 final 但 也 没有 被 重新 赋值 ) 。 


6.3.5 throws 


异常 机 制 中 ， 还 有 一 个 和 throw 很 像 的 关键 子 throws， 用 于 声明 一 
个 方法 可 能 抛 出 的 异常 ， 语 法 如 下 所 示 : 


public void test() throws AppException, 
SQLException, NumberFormatException { 
// 主 体 代码 

} 


throws 跟 在 方法 的 括号 后 面 ， 可 以 声明 多 个 异常 ， 以 如 号 分 阳 。 
这 个 声明 的 含义 是 ， 这 个 方法 内 可 能 抛 出 这 些 异 第 ， 且 没有 对 这 些 异 
党 进行 处 理 ， 至 少 没有 处 理 完 ， 调 用 者 必须 进行 处 理 。 这 个 声明 没有 
说 明 具 体 什 么 情况 会 抛 出 什么 异常 ， 作 为 一 个 恨 好 的 实践 ， 应 该 将 这 
些 信息 用 注释 的 方式 进行 说 明 ， 这 样 调用 者 才能 更 好 地 处 理 异 音 。 


”对 于 未 受 检 异 常 ， 是 不 要 求 使 用 throws 进 行 声明 的 ， 但 对 于 受 检 
异常 ， 则 必须 进行 声明 ， 换 句 话说， 如 果 没 有 声明 ， 则 不 能 抛 出 。 


对 于 受 检 异 常 ， 不 可 以 抛 出 而 不 声明 ， 但 可 以 声明 抛 出 但 实际 不 
抛 出 。 这 主要 用 于 在 父 类 方法 中 声明 ， 父 类 方法 内 可 能 没有 抛 出 ， 但 
子 类 重 写 方法 后 可 能 束 抛 出 了 ， 子 类 不 能 抛 出 父 类 方法 中 没有 声明 的 
受 检 异 第 ， 所 以 就 将 所 有 可 能 抛 出 的 异常 都 写 到 父 类 上 了 。 

如 果 一 个 方法 内 调用 了 男 一 个 声明 抛 出 受 检 了 异 第 的 方法 ， 则 必须 


处 理 这 些 受 检 模 常 ， 处 理 的 方式 既 可 以 是 catch， 也 可 以 是 继续 使 用 
throws， 如 下 所 示 : 


public void tester() throws AppException { 
try { 
test(); 
} catch(SQLException e) { 
e.printStackTrace( ); 
} 


} 


对 于 test 抛 出 的 SQLException， 这 里 使 用 了 catch， 而 对 于 
AppException， 则 将 其 添加 到 了 上 自己 方法 的 throws 语 句 中 ， 表 示 当 前 方 
法 处 理 不 了 ， 继 续 由 上 层 处 理 。 


6.3.6 ”对 比 受 检 和 未 受 检 腊 党 


通过 以 上 介绍 可 以 看 出 ， 未 受 检 异 常 和 受 检 异 常 的 区 别 如 下 ; 受 
入 异 常 必须 出 现在 throws 语 名 中 ， 调 用 者 必须 处 理 ，Java 编 译 器 会 强 抽 
这 一 点 ， 而 未 受 检 异 常 则 没有 这 个 要 求 。 


为 什么 要 有 这 个 区 分 呢 ? 我 们 目 己 定 义 异 党 的 时 候 应 该 使 用 受 检 
还 是 未 受 检 模 党 呢 ? 对 于 这 个 问题 ， 业界 有 各 种 各 样 的 观点 和 争论 ， 
没有 特别 一 致 的 结论 。 


一 种 普 衣 的 说 法 是 ， 未 受 检 模 党 表示 编程 的 逻辑 错误 ， 编 程 时 应 
该 检查 以 避免 这 些 错 误 ， 比 如 空 指针 异 章 ， 如 有 果真 的 出 现 了 这 些 异 
常 ， 程 序 退 出 也 是 正常 的 ， 程 序 员 应 该 检查 程序 代码 的 bug 而 不 是 想 办 
法 处 理 这 种 异 痹 。 受 检 异 弟 表 示 程 序 本 身 没 问 题 ， 但 由 于 1/O、 网 络 、 
0 
图。 


但 其 实 编程 错误 也 是 应 该 进行 处 理 的 ， 尤 其 是 Java 被 广泛 应 用 于 
服务 万 程序 中 ， 不 能 因为 一 个 逻辑 错误 加 使 程序 退出 。 所 以 ， 目 前 一 
种 更 被 认同 的 观点 是 ，Java 中 对 受 检 异 肖 和 未 受 检 异 第 的 区 分 是 没有 
太 大 意义 的 ， 可 以 统一 使 用 未 受 检 异 稼 来 代替 。 


这 种 观点 的 基本 理由 是 : 无论 古 受 检 异 第 还 是 林 受 检 异 第 ， 无 论 
是否 出 现在 throws 声 明 中 ， 都 应 该 在 合适 的 地 方 以 适当 的 方式 进行 处 
理 ， 而 不 只 是 为 了 满足 编译 需 的 要 求 盲目 处 理 异 常 ， 既 然 都 要 进行 处 
理 异 常 ， 受 检 腊 常 的 强制 声明 和 处 理 吕 显 得 烦琐 ， 尤 其 是 在 调用 层次 
比较 深 的 情况 下 。 


其 实 观 点 本 喘 并 不 太 重 要 ， 更 重要 的 是 一 致 性 ， 一 个 项 目 中 ， 应 
该 对 如 何 使 用 异 间 达成 一 致 ， 并 按照 约定 使 用 。 


6.4 如 何 使 用 异种 


针对 有 异常， 我 们 介绍 了 try/catch/finally 、catch 匹 配 、 重 新 抛 出 、 
throws、 受 检 / 示 受 检 异常 ， 那 到 讨 该 如 何 使 用 异常 呢 ? 下面 从 异常 的 
适用 和 情况、 异常 处 理 的 目标 和 一 般 逻 辑 等 多 个 角度 进行 介绍 。 


6.4.1 有 异 音 应 该 且 仅 用 于 异 毅 情 况 


异常 应 该 且 仅 用 于 异常 情况 ， 是 指 异 党 不 能 代替 正常 的 条 件 判 
呆 。 比 如 ， 循 环 处 理 数组 元 闵 的 时 候 ， 应 该 先 检 查 索引 是 否 有 效 再 进 
行 处 理 ， 而 不 是 等 着 抛 出 索引 异常 再 结束 循环 。 对 于 一 个 引用 变量 ， 
如 果 正 常情 况 下 它 的 值 也 可 能 为 null， 那 就 应 该 先 检 查 是 不 是 null， 不 
为 null 的 情况 下 再 进行 调用 。 

另 一 方面 ， 真 正 出 现 异 常 的 时 候 ， 应 该 抛 出 异常 ， 而 不 是 返回 特 
ie 人 String 的 substring () 方法 返回 一 个 子 字符 串 ， 如 代码 清 

6-3 有 所 不 。 


代码 清单 6-3 String 的 substring () 方法 


public String substring(int beginIndex) { 
if(beginIndex < 0) { 
throw new StringIndexOutOofBoundsException(beginIndex); 
} 


int subLen = value.length - beginIndex; 
if(subLen < 0) { 
throw new StringIndexOutofBoundsException(subLen); 


} 
return(beginIndex == 0) ? this : new String(value, beginIndex, subLen); 


代码 会 检查 beginIndex 的 有 效 性 ， 如 果 无 效 ， 会 抛 出 
StringIndexOutOfBoundsExcep-tion 异 常 。 纯 技术 上 一 种 可 能 的 蔡 代 方 
法 是 不 抛 出 异常 而 返回 特殊 值 null， 但 beginIndex 无 效 是 异常 情况 ， 弄 
常 不 能 作为 正常 处 理 。 


6.4.2 异常 处 理 的 目标 


异常 大 概 可 以 分 为 三 种 来 源 : 用 户 、 程 序 员 、 人 第 三 方 。 用 户 是 指 

用 户 的 输入 有 问题 ， 程 序 员 是 指 编程 错误 ， 第 三 方 沁 指 其 他 情况 ， 如 

0 
理 。 


处 理 的 目标 可 以 分 为 恢复 和 报告 。 恢复 是 指 通过 程序 目 动 解决 问 
题 。 报 告 的 最 终 对 象 可 能 是 用 户 ， 即 程序 使 用 者 ， 也 可 能 是 系统 运 维 
ee 


对 用 户 ， 如 果 用 户 输入 不 对 ， 可 以 提示 用 户 具 体 哪里 输入 不 对 ， 
如 有 果 是 编程 错误 ， 可 以 提示 用 户 系 统 错误 、 建 议 联系 客服 ， 如 采 是 第 
三 方 连接 问题 ， 可 以 提示 用 户 稍 后 重 试 。 


对 系统 运 维 人 员 或 程序 员 ， 他 们 一 般 不 关心 用 户 输入 错误 ， 而 天 
注 编程 错误 或 第 三 方 错 误 ， 对 于 这 些 错误 ， 和 需要 报告 尽量 完整 的 细 
玉 ， 包 括 异 彰 链 、 异 音 栈 等 ， 以 便 尽 快 定 位 和 解决 问题 。 


用 户 输入 或 编程 错误 一 般 都 是 难以 通过 程序 目 动 解决 鸣 ， 第 三 方 
错误 则 可 能 可 以 ， 长 至 很 多 时 候 ， 程 序 都 不 应 该 假定 第 三 方 是 可 靠 
的 ， 应 该 有 容错 机 制 。 比 如 ， 某 个 第 三 方 服 务 连 接 不 上 (比如 发 短 
信 ) ， 可 能 的 容错 机 制 是 换 另 一 个 提供 同样 功能 的 第 三 方 试 坛 ， 还 可 
能 是 间隔 一 段 时 间 进 行 重 试 ， 在 多 次 失败 之 后 再 报告 错误 。 


6.4.3 ”异常 处 理 的 一 般 逻 辑 


如 果 目 己 知道 怎么 处 理 有 异常 ， 束 进行 处 理 ， 如 果 可 以 通过 程序 日 
动 解 决 ， 束 目 动 解 决 ， 如 林 异 名 可 以 馈 目 己 解 决 ， 忠 不 需要 再 向 上 报 


如 果 目 己 不 能 完全 解决 ， 就 应 该 同上 报告 。 如 果 上 自己 有 额外 信息 
可 以 提供 ， 有 助 于 分 析 和 人 解决 问题 ， 束 应 该 提供 ， 可 以 以 原 异 常 为 
cause 重 新 抛 出 一 个 异常 。 


总 有 一 层 代码 需要 为 异常 人 负责， 可 能 是 知道 如 何 处 理 该 异常 的 代 
码 ， 可 能 是 面 对 用 户 的 代码 ， 也 可 能 是 主 程序 。 如 有 果 和 异常 不 能 目 动 解 
决 ， 对 于 用 户 ， 应 该 根据 异常 信息 提供 用 户 能 理解 和 对 用 户 有 帮助 的 


信息 ， 对 运 维和 开发 人 员 ， 则 应 该 输出 详细 的 异常 链 和 异常 栈 到 日 


这 个 逻辑 与 在 公司 中 处 理 问 题 的 逻辑 是 类 似 的 ， 每 个 级 别 都 有 目 
己 应 该 解决 的 问题 ， 目 己 能 处 理 的 目 己 处 理 ， 不 能 处 理 的 就 应 该 报告 
上 级 ， 把 下 级 告诉 他 的 和 他 目 己 知道 的 一 并 告诉 上 级 ， 最 终 ， 公 司 老 
ee 
避 责 任 。 


本 章 介 绍 了 Java 中 的 异 第 机 制 。 在 没有 异 营 机 制 的 情况 下 ， 唯 一 
的 退出 机 制 是 return， 判 断 是 否 异常 的 方法 就 是 返回 值 。 方 法 根据 是 否 
异常 返回 不 同 的 返回 值 ， 调 用 者 根据 不 同 返回 值 进行 判断 ， 并 进行 相 
应 处 理 。 每 一 层 方法 都 需要 对 调用 的 方法 的 每 个 不 同 返回 值 进行 检查 
和 处 理 ， 程 序 的 正常 逻辑 和 有 异 间 逻辑 混杂 在 一 起 ， 代 码 往往 难以 阅读 
理解 和 维护 。 另 外 ， 因 为 异 间 毕竟 旦 少数 情况 ， 程 序 员 经 党 偷懒 ， 假 
人 


在 有 了 腊 闻 机 制 后 ， 程 序 的 正 冲 逻辑 与 异常 逻辑 可 以 相 分离 ， 异 
常情 况 可 以 集中 进行 处 理 ， 异 常 还 可 以 目 动 同 上 传递 ， 不 再 需要 每 层 
方法 都 进行 处 理 ， 腊 党 也 不 再 可 能 被 目 动 忽略 ， 从 而 ， 处 理 异 常情 况 
的 代码 可 以 大 大 减少 ， 代 码 的 可 读 性 、 可 靠 性 、 可 维护 性 也 都 可 以 得 


到 提高 。 


至 此 ， 关 于 Java 语 言 本 身 的 主要 概念 我 们 就 介绍 得 差不多 了 ， 下 
一 章 ， 我 们 介绍 一 些 第 用 的 基础 类 。 


第 7 草 ”第 用 基础 类 
A 的 基础 类 ， 探 讨 它们 的 用 法 、 应 用 
各 种 包装 类 ，; 
:文本 处 理 的 类 String 和 StringBuilder:; 
数组 操作 的 类 Arrays: 
日 期 和 时 间 处 理 ; 
随机 。 


7.1 包装 类 


Java 有 8 种 基本 类 型 ， 每 种 基本 类 型 都 有 一 个 对 应 的 包 疼 类 。 包 交 
类 是 什么 呢 ? 它 是 一 个 类 ， 内 部 有 一 个 实例 变量 ， 保 存 对 应 的 基本 类 
型 的 值 ， 这 个 类 一 般 还 有 一 些 静 态 方法 、 静 态 变 量 和 实例 方法 ， 以 方 
便 对 数据 进行 操作 。Java 中 ， 基 本 类 型 和 对 应 的 包 狂 类 如 表 7-1 所 示 。 


表 7-1 基本 类 型 和 对 应 的 包 洲 类 


基本 类 型 包装 类 
boolean Boolean Long 

byte Float 

short double Double 

int Integer Character 


包装 类 也 都 很 好 记 ， 除 了 Integer 和 Character 外 ， 其 他 类 名 称 与 基本 
类 型 基本 一 样 ， 只 是 首 字 母 大 写 。 包 装 类 有 什么 用 呢 ? Java 中 很 多 代码 
比如 后 续 章 忆 介 绍 的 容器 类 ) 只 能 操作 对 象 ， 为 了 能 操作 基本 类 
型 ， 需 要 使 用 其 对 应 的 包装 类 。 另 外 ， 包 装 类 提供 了 很 多 有 用 的 方 
法 ， 可 以 方便 对 数据 的 操作 。 下 面 完 介绍 各 个 包装 类 的 基本 用 法 及 其 
共同 点 ， 然 后 重点 介绍 Integer 和 Character 。 


7.1.1 基本 用 法 


各 个 包装 类 都 可 以 与 其 对 应 的 基本 类 型 相互 转换 ， 方 法 也 是 类 似 
的 ， 部 分 类 型 如 表 7-2 所 示 。 


表 7-2 ” 包 疼 类 与 基本 类 型 的 转换 


包装 类 与 基本 类 型 的 转换 示例 代码 装 类 与 基本 类 型 的 转换 示例 代码 
bl = false: double dl = 123.45; 
Boolean | Boolean bOb] = Boolean.valueOf(b]1): Double Double dObj = Double.valueOf(d1l); 
boolean b2 = bObj.booleanValue(): double d2 = dObj.doubleValue(): 
int ll = 12345; char cl = 'A': 
Integer Integer i10b]j = Integer.valueOf(i1): Character | Character cObj = Character.valueOf(c1); 


int 12 = 10bj.intValue(): char c2 = cObj.charValue(): 


包装 类 与 基本 类 型 的 转换 代码 结构 是 类 似 的 ， 每 种 包装 类 都 有 一 
个 静态 方法 valueOf () ， 接 受 基本 类 型 ， 返 回 引用 类 型 ， 也 都 有 一 个 
实例 方法 xxxValue () 返回 对 应 的 基本 类 型 。 


将 基本 类 型 转换 为 包装 类 的 过 程 ， 一 般 称 为 “ 洲 箱 ”， 而 将 包装 类 
型 较 换 为 基本 类 型 的 过 程 ， 则 称 为 “ 拆 箱 ”。 疼 箱 / 拆 箱 写 起 来 比较 和 烦 
珊 ，Java 5 以 后 引入 了 目 动 痛 箱 和 拆 箱 扩 术 ， 可 以 直接 将 基本 类 型 赋值 
给 引用 类 型 ， 反 之 亦 可 ， 比 如 : 


Integer a = 100; 
int b = a; 


自动 装 箱 / 拆 箱 是 Java 编 译 絮 提供 的 能 力 ， 背 后 ， 它 会 蕉 换 为 调用 
对 应 的 valueOfxxx-Value 方 法 ， 比 如 ， 上 面 的 代码 会 被 Java 编 译 器 替换 
为 ， 


Integer a = Integer.VvValueof(100) 
int b = a.intValue(); 


每 种 包装 类 也 都 有 构造 方法 ， 可 以 通过 new 创 建 ， 比 如 : 


Integer a = new Integer(100) 
Boolean b = new Boolean(true); 
Double d = new Double(12.345); 
Character c = new Character( ' 马 ' ); 


那 到 底 应 该 用 静态 的 valueOf 人 方法 ， 还 是 使 用 new 呢 ? 一 般 建 议 使 
用 valueOf 方 法 。new 每 次 都 会 创建 一 个 新 对 象 ， 而 除了 Float 和 Double 
外 的 其 他 包装 类 ， 都 会 缓存 包装 类 对 象 ， 减 少 需要 创建 对 象 的 次 数 ， 
节省 空间 ， 提 升 性 能 。 实 际 上 ， 从 Java 9 开始 ， 这 些 构造 方法 已 经 被 标 
记 为 过 时 了 ， 推 荐 使 用 静态 的 valueOf 方 法 。 


YL 共同 遍 


各 个 包 闭 类 有 很 多 共同 点 ， 比 如 ， 都 重 写 了 Object 中 的 一 些 方法 ， 
都 实现 了 Comparable 接 口 ， 都 有 一 些 与 String 有 关 的 方法 ， 大 部 分 都 定 
义 了 一 些 静 态 常量 ， 都 是 不 可 变 的 。 下 面具 体 介绍 。 


1. 重 写 Object 方 法 
所 有 包装 类 都 重 写 了 Object 类 的 如 下 方法 : 


boolean equals(Object obj) 
int hashCode() 
String toString() 


我 们 分 别 介 绍 。 
(1) equals 


equals 用 于 判断 当前 对 象 和 参数 传 入 的 对 象 是 否 相 同 ，Object 类 的 
默认 实现 是 比较 地 址 ， 对 于 两 个 变量 ， 只 有 这 两 个 变量 指 癌 同一 个 对 
象 时 ，equals 才 返回 true， 它 和 比较 运算 符 (==) 的 结果 是 一 样 的 。 


equals 应 该 反映 的 是 对 象 间 的 逻辑 相等 天 系 ， 所 以 这 个 默认 实现 一 
般 是 不 合适 的 ， 子 类 需要 重 写 该 实现 。 所 有 包装 类 都 重 写 了 该 实现 ， 
ee 比如 ， 对 于 Long 类 ， 其 equals 方 
法 代码 如 下 : 


public boolean equals(Object obj) { 
if(obj instanceof Long) { 
return value == ((Long)obj).longVvalue(); 


} 
return false,; 


} 


对 于 Float， 其 实现 代码 如 下 : 


public boolean equals(Object obj) { 
return(obj instanceof Float) 
&& (floatToIntBits(((Float)obj).value) == floatToIntBits(value)); 
} 


Float 有 一 个 静态 方法 floatToIntBits () ， 将 float 的 二 进 制 表示 看 作 
int。 需 要 注意 的 是 ， 只 有 两 个 float 的 二 进 制 表示 完全 一 样 的 时 候 ， 
equals 才 会 返回 true。 在 2.2 节 的 时 候 ， 我 们 提 到 小 数 计算 是 不 精确 的 ， 
0 但 计算 机 运算 结果 可 能 不 同 ， 比 如 下 面 的 


Float f1 = 0.01f; 

Float f2 = 0.1f*0.1f,; 
System.out.printin(f1i.equals(f2)); 
System.out.printlin(Float.floatToIntBits(f1)); 
System.out.printlin(Float.floatToIntBits(f2)); 


输出 为 : 


false 
1008981770 
1008981771 


区 
过 
f 训 


， 两 个 译 上 总数 不 一 样 ， 将 二 进 制 看 作 整 数 也 不 一 样 ， 相 产 
全 


Double 的 equals 方 法 与 Float 类 似 ， 它 有 一 个 静态 方法 
doubleToLongBits， 将 double 的 二 进 制 表示 看 作 long， 然 后 再 按 long 比 
较 。 


(2) hashCode 


hashCode 返 回 一 个 对 象 的 哈 希 值 。 哈 硕 值 是 一 个 int 类 型 的 数 ， 由 
对 象 中 一 般 不 变 的 属性 映射 得 来 ， 用 于 快速 对 对 象 进行 区 分 、 分 组 
等 。 一 个 对 象 的 哈 布 值 不 能 改变 ， 相 同 对 象 的 哈 硕 值 必须 一 样 。 不 同 
对 象 的 哈 希 值 一 般 应 不 同 ， 但 这 不 是 必需 的 ， 可 以 有 对 象 不 同 但 哈 硕 
值 相 同 的 情况 。 


比如 ， 对 于 一 个 班 的 学 生 对 象 ，hashCode 可 以 是 学 生 的 出 生日 
期 ， 出 生日 期 是 不 变 的 ， 不 同学 生生 日 一 般 不 同 ， 分 布 比 较 均 匀 ， 个 
别 生日 相同 的 也 没关系 。 


hashCode 和 equals 方 法 联系 密切 ， 对 两 个 对 象 ， 如 采 equals 方 法 返 
回 true， 则 hashCode 也 必须 一 样 。 反 之 不 要 求 ，equal 方 法 返回 false 时 ， 
hashCode 可 以 一 样 ， 也 可 以 不 一 样 ， 但 应 该 尽量 不 一 样 。hashCode 的 
默认 实现 一 般 是 将 对 象 的 内 存 地 址 转换 为 整数 ， 子 类 如 果 重 写 了 equals 
方法 ， 也 必须 重 写 hashCode。 之 所 以 有 这 个 规定 ， 是 因为 Java API 中 很 
多 类 依赖 于 这 个 行为 ， 尤 其 是 容 名 中 的 一 些 类 。 


包 关 类 都 重 写 了 hashCode， 根 据 包 闭 的 基本 类 型 值 计算 
hashCode， 对 于 Byte、Short、Integer、Character，hashCode 束 是 其 内 部 
值 ， 代 码 为 : 


public int hashcode() { 
return (int)value; 


对 于 Boolean，hashCode 代 码 为 : 


public int hashcode() { 
return value ? 1231 : 1237; 


根据 基 类 类 型 值 返 回 了 两 个 不 同 的 数 ， 为 什么 选 这 两 个 值 呢 ? 它 
们 是 质数 〈 即 只 能 被 1 和 上 自己 整除 的 数 ) ， 质 数 用 于 哈 硕 时 比较 好 ， 不 


容易 冲突 。 


对 于 Long，hashCode 代 码 为 : 


public int hashcode() { 
return(int)(value ^ (value >>> 32)); 


是 高 32 位 与 低 32 位 进行 位 异 或 操作 。 
对 于 Float，hashCode 代 码 为 : 


public int hashcode() { 
return floatToIntBits(value); 


与 equals 方 法 类 似 ， 将 float 的 二 进 制 表示 看 作 int 。 
对 于 Double，hashCode 代 码 为 : 


public int hashcode() { 
long bits = doubleToLongBits(value); 


return(int)(bits 人 ^ (bits >>> 32)); 
与 equals 方 法 类 似 ， 将 double 的 二 进 制 表示 看 作 long， 然 后 再 按 long 


计算 hashCode 。 
每 个 包装 类 也 都 重 写 了 toString 方 法 ， 返 回 对 象 的 字符 串 表 示 ， 这 


个 一 般 比 较 目 然 ， 不 再 资 述 。 


2.Comparable 
每 个 包装 类 都 实现 了 Java API 中 的 Comparable 接 口 。Comparable 接 


口 代码 如 下 : 


public interface Comparable<T> { 
public int compareTo(T 0); 


} 
<T> 是 泛 型 语法 ， 我 们 在 第 8 章 介 绍 ，T 表 示 比 较 的 类 型 ， 由 实现 接 
口 的 类 传 入 。 接 口 只 有 一 个 方法 compareTo， 当 前 对 象 与 参数 对 象 进行 
比较 ， 在 小 于 、 等 于 、 大 于 参数 时 ， 应 分 别 返 回 -1、0、1。 

各 个 包装 类 的 实现 基本 都 是 根据 基本 类 型 值 进行 比较 ， 不 再 玖 
述 。 对 于 Boolean，false 小 于 true。 对 于 Float 和 Double， 存 在 和 equals 方 
法 一 样 的 问题 ，0.01 和 0.1*0.1 相 比 的 结果 并 不 为 0。 


3. 包 装 类 和 String 
除了 toString 方 法 外 ， 包 装 类 还 有 一 些 其 他 与 String 相 关 的 方法 。 除 


法 
了 Character 外 ， 每 个 包装 类 都 有 一 个 静态 的 valueOf (String) 方法 ， 根 
据 字符 串 表 示 返 回 包装 类 对 象 ， 如 ; 


Boolean b = Boolean.valueof("true"); 
Float f = Float.valueof("123.45f"); 


也 都 有 一 个 静态 的 parseXXX (String) 方法 ， 根 据 字 符 串 表示 返回 


基本 类 型 值 ， 如 : 


boolean b = Boolean.parseBoolean("true" )， 
double d = Double.parseDouble("123.45"); 


都 有 一 个 静态 的 toString 方 法 ， 根 据 基 本 类 型 值 返回 字符 串 表示 ， 
Mk 


System.out.println(Boolean.toString(true)); 
System.out.printlin(Double.toString(123.45)); 


输出 : 


true 
123.45 


对 于 整数 类 型 ， 字 符 串 表示 除了 默认 的 十 进 制 外 ， 还 可 以 表示 为 
人 进 制 、 八 进 制 和 十 六 进 制 ， 包 闪 类 有 静 仿 方法 进行 相 
;El 


System.out,.println(Integer.toBinaryString(12345) ) // 输 出 二 进 制 
System.out.println(Integer.toHexString(12345) ) ; // 输 出 十 六 进 制 
System.out.println(Integer.parseInt("3039"，16) )， // 按 十 六 进 制 解析 


输出 : 


11000000111001 
3039 
12345 


4. 常 用 常量 


包装 类 中 除了 定义 静态 方法 和 实例 方法 外 ， 还 定义 了 一 些 静 态 变 
。 对 于 Boolean 类 型 ， 有 : 


public static final Boolean TRUE = new Boolean(true); 
public static final Boolean FALSE = new Boolean(false); 


所 有 数值 类 型 都 定义 了 MAX_VALUE 和 MIN_VALUE， 表 示 能 表示 
的 最 大 /最 小 值 ， 比 如 ， 对 Integer: 


public static final int MIN_VALUE = 0x80000000 
public static final int MAX_VALUE = Ox7fffffff,; 


Float 和 Double 还 定义 了 一 些 特殊 数值 ， 比 如 正 无 穷 、 负 无 穷 、 非 
数值 ， 如 Double 类 : 


public static final double POSITIVE_INFINITY = 1.0 / 0.0; // 正 无 穷 
public static final double NEGATIVE_INFINITY = -1.0 / 0.0; // 负 无 穷 
public static final double NaN = 0.0d / 0.0; // 非 数值 


5.Number 


6 种 数值 类 型 包 泌 类 有 一 个 共同 的 父 类 Number。Number 十 一 个 抽 
象 类 ， 它 定义 了 如 下 方法 : 


byte bytevalue() 
short shortValue() 
int intValue() 

long longValue() 
float floatValue() 
double doublevalue() 


前 过 这 些 方法 ， 包 装 类 实例 可 以 返回 任意 的 基本 数值 类 型 。 
6. 不 可 变性 


包装 类 都 是 不 可 变 类 。 所 谓 不 可 变 是 指 实 例 对 象 一 旦 创建 ， 就 没 
有 办 法 修改 了 。 这 是 通过 如 下 方式 强制 实现 的 : 


-所 有 包 闪 类 都 声明 为 了 final， 不 能 被 继承 。 
-内 部 基本 类 型 值 是 私有 的 ， 且 声明 为 了 final。 
-没有 定义 setter 方 法 。 


为 什么 要 定义 为 不 可 变 类 呢 ? 不 可 变 使 得 程序 更 为 简单 安全 ， 
为 不 用 操心 数据 被 意外 改写 的 可 能 ， 可 以 安全 地 共享 数据 ， 尤 其 是 在 
多 线程 的 环境 下 。 关 于 线程 ， 我 们 在 第 15 章 介绍 。 


7.1.3 剖析 Integer 与 二 进 制 算法 


本 小 节 主 要 介绍 Integer 类 ，Long 与 Integer 类 似 ， 就 不 再 单独 介绍 
了 。 一 个 简单 的 Integer 还 有 什么 要 介绍 的 呢 ? 它 有 一 些 二 进 制 操作 ， 包 
括 位 翻转 和 循环 移 位 等 ， 另 外 ， 我 们 也 分 析 一 下 它 的 valueOf 实 现 。 为 
什么 要 天 心 实 现代 码 呢 ? 大 部 分 情况 下 ， 确 实 不 用 关心， 会 用 它 束 可 
以 了 ， 我 们 主要 是 学 习 其 中 的 二 进 制 操作 。 二 进 制 是 计算 机 的 基础 ， 
但 代码 往往 星 涩 难 懂 ， 我 们 希望 对 其 有 一 个 更 为 清晰 深刻 的 理解 。 


1. 位 翻转 
Integer 有 两 个 静态 方法 ， 可 以 按 位 进行 翻转 : 


public static int reverse(int i) 
public static int reverseBytes(int i) 


位 翻转 就 是 将 int 当 作 二 进 制 ， 左 边 的 位 与 右边 的 位 进行 互 换 ， 
Sn reverseBytes 是 按 byte 进 行 互 换 ， 我 们 来 看 个 例 


int a = Ox12345678; 
System.out.printin(Integer.toBinaryString(a)); 
int r = Integer.reverse(a); 
System.out.printin(Integer.toBinaryString(r)); 
int rb = Integer.reverseBytes(a); 
System.out.printin(Integer.toHexSstring(rb)); 


a 是 整数 ， 用 十 六 进 制 赋值 ， 首 先 输出 其 二 进 制 字符 串 ， 接 春 输 出 
reverse 后 的 二 进 制 ， 最 后 输出 reverseBytes 后 的 十 六 进 制 ， 输 出 为 : 


10010001101000101011001111000 
11110011010100010110001001000 
78563412 


reverseBytes 是 按 字 节 翻 转 ，78 是 十 六 进 制 表 示 的 一 个 字 节 ，12 也 
是 ， 所 以 结果 78563412 是 比较 容易 理解 的 。 二 进 制 翻转 初 看 是 不 对 
， 这 是 因为 输出 不 是 32 位 ， 输 出 时 忽略 了 前 面 的 0， 我 们 补 齐 32 位 再 


00010010001101000101011001111000 
00011110011010100010110001001000 


这 次 结 


束 对 了 。 这 两 个 方法 是 怎么 实现 的 呢 ? 
先 来 看 reverseBytes 的 代码 : 


public static int reverseBytes(int i) { 
return ((i >>> 24) 


) 
((i >> 8) & 9xFF00) | 
((i << 8) & 9xFF0000) | 
((i << 24)); 


. 代码 比较 星 涩 ， 以 参数 等 于 0x12345678 为 例 ， 我 们 来 分 析 执 行 过 
时 : 


1) i>>>24 无 符号 右 移 ， 


最 高 字 市 挪 到 最 低位 ， 结 果 是 
0x00000012; 
2) ” (i>>8) &0xFF00， 左 边 第 二 个 字 节 挪 到 右边 第 二 个 ，i>>8 结 
果 是 0x00123456， 再 进行 &0xFF00， 保 留 的 是 右边 第 二 个 字 节 ， 结 
是 0x00003400: 
3) 


(i<<8) &0xFF0000， 右 边 第 二 个 字 节 挪 到 左边 第 二 个 ， 


结果 是 0x34567800， 再 进行 &0xFF0000， 保 留 的 是 右边 第 三 个 字 节 ， 
结果 是 0x00560000; 


4) i<<24， 结 果 是 0x78000000， 最 右 字 节 挪 到 最 左边 
疆 文 


人 
这 4 个 结果 再 进行 或 操作 |， 结 果 束 是 0x78563412， 这 样 ， 通 过 左 
移 、 右 移 、 与 和 或 操作 ， 就 达到 了 字 节 翻转 的 目的 。 


我 们 再 来 看 reverse 的 代码 : 


public static int reverse(int i) { 
//HD, Figure 7-1 
i= (i & Ox55555555) << 1 | (i >>> 1) & 0x55555555 ; 
i = (i & Ox33333333) << 2 | (i >>> 2) & 0x33333333; 
i= (i & OxOfOfOfOf) << 4 | (i >>> 4) & 0xofofofof ; 
i= (i << 24) | ((i & QOxff00) << 8) | 

((i >>> 8) & Oxff00) | (i >>> 24); 

return i; 


这 上 段 代码 虽然 很 短 ， 但 非常 星 深 ， 到 底 是 什么 意思 呢 ? 代码 第 一 
行 是 一 个 注释 ，HD 表 示 的 是 一 本 书 ， 书 名 为 Hacker’s Delight， 中 文 版 
为 《算法 心得 : 高 效 算 法 的 奥秘 》，HD 是 它 的 缩写 ，Figure 7-1 是 书 中 
的 图 7-1，reverse 的 代码 就 是 复制 了 这 本 书 中 图 7-1 的 代码 ， 书 中 也 说 明 
了 代码 的 思路 ， 我 们 简要 说 明 。 


高 效 实现 位 翻转 的 基本 思路 是 : 首先 交换 相 邻 的 单一 位 ， 然 后 以 
两 位 为 一 组 ， 再 交换 相 邻 的 位 ， 接 着 是 4 位 一 组 交换 、 然 后 是 8 位 、16 
位 ，16 位 之 后 就 完成 了 。 这 个 思路 不 仅 适 用 于 二 进 制 ， 而 且 适 用 于 十 
我 们 看 个 十 进 制 的 例子 。 比 如 对 数字 12345678 进 
行 翻转 。 


第 一 轮 ， 相 邻 单一 数字 进行 互 换 ， 结 来 为 : 
第 二 轮 ， 以 两 个 数字 为 一 组 交换 相 邻 的 ， 结 来 为 : 


A 


第 三 轮 ， 以 4 个 数 子 为 一 组 交换 相 邻 的 ， 结 果 为 : 


8765 4321 


翻转 完成 。 


对 十 进 制 而 言 ， 这 个 效率 并 不 高 ， 但 对 于 二 进 制 而 言 ， 却 是 高 效 
的 ， 因 为 二 进 制 可 以 在 一 条 指令 中 交换 多 个 相 邻 位 。 下 面 代码 就 是 对 


相 邻 单一 位 进行 互 换 : 
x = (x & Ox55555555) << 1 | (x & OxAAAAAAAA) >>> 1; 


5 的 二 进 制 表示 是 0101，0x55555555 的 二 进 制 表示 是 : 


01010101010101010101010101010101 


x&0x55555555 束 是 取 x 的 奇数 位 。 


A 的 二 进 制 表示 是 1010，0xAAAAAAAA 的 二 进 制 表示 是 : 


10101010101010101010101010101010 


x&0xAAAAAAAA 就 是 取 x 的 偶数 位 。 


(x & Ox55555555) << 1 | (x & OxAAAAAAAA) >>> 1; 


表示 的 就 是 x 的 奇数 位 癌 左 移 ， 侦 数位 同 右 移 ， 然 后 通过 | 合并 ， 达 
到 相 邻 位 互 换 的 目的 。 这 上段 代码 可 以 有 个 小 的 优化 ， 只 使 用 一 个 常量 
0x55555555， 后 半 部 分 先 移 位 再 进行 与 操作 ， 变 为 : 


(i & Ox55555555) << 1 | (i >>> 1) & 0x55555555 ; 


同 理 ， 如 下 代码 就 是 以 两 位 为 一 组 ， 对 相 邻 位 进行 互 换 : 


i = (i & 0x33333333) << 2 | (i & QOxCCCCCCCC)>>>2; 


3 的 二 进 制 表示 是 0011，0x33333333 的 二 进 制 表 示 是 : 


00110011001100110011001100110011 


Xx&x0x33333333 就 是 取 x 以 两 位 为 一 组 的 低 半 部 分 。 


C 的 二 进 制 表示 是 1100，0xCCCCCCCC 的 二 进 制 表示 是 : 


11001100110011001100110011001100 


x&0xCCCCCCCC 就 是 取 x 以 两 位 为 一 组 的 高 半 部 分 。 


(i & 0x33333333) << 2 | (i & QOxCCCCCCCC)>>>2; 


表示 的 就 是 x 以 两 位 为 一 组 ， 低 半 部 分 癌 高 位 移 ， 高 半 部 分 癌 低 位 
移 ， 然 后 通过 | 合并 ， 达 到 交换 的 目的 。 同 样 ， 可 以 去 掉 常 量 
0xCCCCCCCC， 代 码 可 以 优化 为 : 


(i & Ox33333333) << 2 | (i >>> 2) & 0x33333333; 


同 理 ， 下 面 代码 艾 是 以 4 位 为 一 组 进行 交换 。 


TI= (1I&Oxofofofof)<< 4 | (i >>> 4) & 0xofofofof ，; 


到 以 8 位 为 单位 交换 时 ， 残 是 字 克 翻转 了 ， 可 以 写 为 如 下 更 直接 的 
形式 ， 代 码 和 reverse-Bytes 基 本 完全 一 样 。 


i= (i << 24) | ((i & Oxff00) << 8) | 
((i >>> 8) & Oxff00) | (i >>> 24); 


reverse 代 码 为 什么 要 写 得 这 么 星 浴 呢 ?或 者 说 不 能 用 更 容易 理解 
的 方式 写 吗 ? 比如， 实现 翻转 ， 一 种 常见 的 思路 是 ， 第 一 个 和 最 后 一 
个 交换 ， 第 二 个 和 倒数 第 二 个 交换 ， 直 到 中 间 两 个 交换 完成 。 如 琳 数 
es 这 个 思路 是 好 的 ， 但 对 于 二 进 制 位 ， 这 个 思路 的 效 
2 A O 


CPU 指令 并 不 能 高 效 地 操作 单个 位 ， 它 操作 的 最 小 数据 单位 一 般 
是 32 位 (32 位 机 器 ) ， 另 外 ，CPU 可 以 高 效 地 实现 移 位 和 逻辑 运算 ， 


但 实现 加 、 减 、 乘 、 除 运算 则 比较 慢 。 


reverse 是 在 充分 利用 CPU 的 这 些 符 性 ， 并 行 蜗 效 地 进行 相 邻 位 的 交 
0 


2. 循 环 移 位 
Integer 有 两 个 静态 方法 可 以 进行 循环 移 位 : 


public static int rotateLeft(int i, int distance) 
public static int rotateRight(int i, int distance) 


rotateLeft 方 法 是 循环 左 移 ，rotateRight 方 法 是 循环 右 移 ，distance 是 
移动 的 位 数 。 所 谓 循环 移 位 ， 是 相对 于 普通 的 移 位 而 言 的 ， 普 通 移 
位 ， 比 如 左 移 2 位 ， 原 来 的 最 高 两 位 就 没有 了 ， 右 边 会 补 0， 而 如 果 是 
循环 左 移 两 位 ， 则 原来 的 最 高 两 位 会 移 到 最 右边 ， 就 像 一 个 左右 相 接 
的 环 一 样 。 看 个 例子 : 


int a = Ox12345678; 

int b = Integer.rotateLeft(a, 8); 
System.out.printlin(Integer.toHexString(b)); 
int c = Integer.rotateRight(a, 8); 
System.out.println(Integer.toHexString(c)) 


b 征 a 循 环 左 移 8 位 的 结 有 末 ，c 和 是 a 循 环 右 移 8 位 的 结 有 末 ， 所 以 输出 为 : 


34567812 
78123456 


这 两 个 函数 的 实现 代码 为 : 


public static int rotateLeft(int i, int distance) { 
return (i << distance) | (i >>> -distance); 


public static int rotateRight(int i, int distance) { 
return (i >>> distance) | (i << -distance); 


这 两 个 函数 中 令 人 费解 的 是 负数 ， 如 果 distance 是 8， 那 这 >>-8 是 什 
么 意思 呢 ? 其 实 ， 实 际 的 移 位 个 数 不 是 后 面 的 直接 数字 ， 而 十 下 接 数 
字 的 最 低 5 位 的 信和 或 者 说 是 直接 数字 &0x1f 的 结果 。 之 所 以 这 样 ， 是 
因为 5 位 最 大 表示 31， 移 位 超过 31 位 对 int 整 数 是 无 效 的 。 


理解 了 移动 负数 位 的 含义 ， 束 比较 容易 理解 上 面 这 段 代码 了 ， 比 
如 ，-8 的 二 进 制 表示 是 : 


11111111111111111111111111111000 


其 最 低 5 位 是 11000， 十 进 制 表示 束 是 24， 所 以 i>>>-8 吏 是 i>>>24， 
i<<8|i>>>24 束 是 循环 左 移 8 位 。 上 面 代码 中 ，i>>>-distance 就 是 i>>> 


(32-distance) ，i<<-distance 就 是 i<< (32-distance) 。 


Integer 中 还 有 一 些 其 他 的 位 操作 ， 有 具体 可 参看 API 文 档 。 关于 其 实 
现代 码 ， 都 有 注释 指向 Hacker’s Delight 这 本 书 的 相关 章节 ， 不 再 丈 述 。 


3.valueOf 的 实现 


在 前 面 ， 我 们 提 到 ， 创 建 包装 类 对 象 时 ， 可 以 使 用 静态 的 valueOf 
方法 ， 也 可 以 直接 使 用 new， ee 为 什么 呢 ? 我 
们 来 看 Integer 的 valueOf 的 代码 〈 基 于 Java7) : 


public static Integer valueof(int i) { 
assert IntegerCache.high >= 127; 
if (i >= IntegerCache.low && i <= IntegerCache.high) 
return IntegerCache.cache[i + (-IntegerCache.1low)]; 
return new Integer(i); 


} 


人 这 是 一 个 私有 静态 内 部 类 ， 如 代码 清单 7-1 
示 “。 


代码 清单 7-1 IntegerCache 


private static class IntegerCache { 
static final int low = -128; 
static final int high; 
static final Integer cache[]; 
static { 


//high value may be configured by property 

int h = 127; 

String integerCacheHighPropValue = 
sun.misc.VM.getSavedProperty( 
"java.lang.Integer.IntegerCache.high"); 

if(integerCacheHighPropValue != null) { 
int i = parseInt(integerCacheHighPropValue); 

i = Math.max(i, 127); 
//Maximum array size is Integer .MAX_ VALUE 
h = Math.min(i, Integer.MAX _ VALUE - (-low) -1); 

} 

high = h， 

cache = new Integer[(high - low) + 1]， 

int j = low; 

for(int k = 0; k < cache.length; k++) 
cache[k] = new Integer(j++); 


private IntegerCache() 人 
+: 


IntegerCache 表 示 Integer 缓 存 ， 其 中 的 cache 变 量 是 一 个 基态 Integer 
数组 ， 在 静态 初始 化 代码 块 中 被 初始 化 ， 默 认 情 况 下 ， 保 存 了 -128~ 
127 共 256 个 整数 对 应 的 Integer 对 象 。 


在 valueOf 代 码 中 ， 如 采 数 值 位 于 被 缓存 的 范围 ， 即 默认 -128~ 
127， 则 直接 从 Integer-Cache 中 获取 已 预先 创建 的 Integer 对 象 ， 只 有 不 
在 缓存 范围 和 时， 才 通 过 new 创 建 对 象 。 


通过 共享 常用 对 象 ， 可 以 节省 内 存 空 间 ， 由 于 Integer 是 不 可 变 的 ， 
所 以 缓存 的 对 象 可 以 安全 地 被 共享 。Boolean、Byte、Short、Long、 
Character 都 有 类 似 的 实现 。 这 种 共享 常用 对 象 的 思路 ， 是 一 种 常见 的 
设计 思路 ， 它 有 一 个 名 字 ， 叫 吝 元 模式 ， 英 文 叫 Flyweight， 即 共享 的 
轻 量 级 元 素 。 


7.1.4 剖析 Character 


本 蔬 探 讨 Character 类 。Character 类 除了 封装 了 一 个 char 外 ， 还 有 什 
么 可 介绍 的 呢 ? 它 有 很 多 静态 方法 ， 封 装 了 Unicode 字 符 级 别 的 各 种 操 
作 ， 是 Java 文 本 处 理 的 基础 ， 注 意 不 是 char 级 别 ，Unicode 字 符 并 不 等 同 
于 char， 本 方 详细 介绍 这 些 方法 。 在 此 之 前 ， 先 来 回顾 一 下 Unicode 知 
识 。 


1.Unicode 基 础 


Unicode 给 世界 上 每 个 字符 分 配 了 一 个 编号 ， 编 号 范围 为 0x000000 
~0xl10FFFF。 编 号 范围 在 0x0000~-0xFFFE 的 字符 为 常用 字符 集 ， 称 
BMP (Basic Multilingual Plane) 字符 。 编 号 范围 在 0x10000~0x10FFFF 
的 字符 叫做 增补 字符 (supplementary character) 。 


Unicode 主 要 规定 了 编号 ， 但 没有 规定 如 何 把 编号 映 届 为 二 进 制 。 
UTF-16 是 一 种 编码 方式 ， 或 者 叫 映射 方式 ， 它 将 编号 映射 为 两 个 或 4 个 
字 节 ， 对 BMP 字 人 符 ， 它 直接 用 两 个 字 市 表示 ， 对 于 增补 字符 ， 使 用 4 个 
字 节 表示 ， 前 两 个 字 广 叫 高 代理 项 (high surrogate) ， 范 围 为 0xD800 
~-0xDBFF， 后 两 个 字 节 叫 低 代 理 项 (low surrogate) ， 范 围 为 0xDC00 
。UTF-16 定 义 了 一 个 公式 ， 可 以 将 编号 与 4 字 节 表示 进行 相 
互 o 


Java 内 部 采用 UTF-16 编 码 ，char 表 示 一 个 字符 ， 但 只 能 表示 BMP 中 
的 字符 ， 对 于 增补 字符 ， 需 要 使 用 两 个 char 表 示 ， 一 个 表示 高 代理 项 ， 
一 个 表示 低 代理 项 。 


使 用 int 可 以 表示 任意 一 个 Unicode 字 符 ， 低 21 位 表示 Unicode 编 号 ， 
高 11 位 设 为 0° 整数 编号 在 Unicode 中 一 般 称 为 代码 点 (code point) ， 
表示 一 个 Unicode 字 符 ， 与 之 相对 ， 还 有 一 个 词 代码 单元 (code unit) 
表示 一 个 char 。 

Character 类 中 有 很 多 相关 静态 方法 ， 下 面 分 别 介绍 。 


2. 检 查 code point 和 char 


五 全 
fe 
基 品 性 
已 二 


折 一 个 int 是 不 是 一 个 有 效 的 代码 点 ， 小 于 等 于 9x10FFFF 的 为 有 效 ， 大 于 的 为 无 效 


ic static boolean isValidCodePoint(int codePoint) 
// 判 断 一 个 int 是 不 是 BMP 字符 ， 小 于 等 于 9xFFFF 的 为 BMP 字符 ， 大 于 的 不 是 


public static boolean isBmpCodePoint(int codePoint) 
// 判 断 一 个 int 是 不 是 增补 字符 ，9x6910000~9X10FFFF 为 增补 字符 


ic static boolean isSupplementaryCodePoint(int codePoint ) 
jl 呆 char 是 否 是 高 代理 项 ，9xD800~9xDBFF 为 高 代理 项 
ic static boolean isHighSurrogate(char ch) 
判断 char 是 否 为 低 代 理 项 ，9xDC90~9xDFFF 为 低 代理 项 
ic static boolean isLowSurrogate(char ch) 
fchar 是 否 为 代理 项 ，char 为 低 代 理 项 或 高 代理 项 ， 则 返回 true 
c static boolean isSurrogate(char ch) 
两 个 字符 high 和 low 是 否 分 别 为 高 代理 项 和 低 代理 项 
c static boolean isSurrogatePalir(char high, char low) 
判断 一 个 代码 点 由 几 个 char 组 成 ， 增 补 字符 返回 2，BMP 字 符 返 回 1 
public static int charCount(int codePoint) 
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3.code point 与 char 的 转换 


除了 人 徐 单 的 检查 外 ，Character 类 中 还 有 很 多 方法 ， 进 行 code point 
与 char 的 相互 转换 。 


// 根 据 高 代理 项 high 和 低 代理 项 low 生 成 代码 点 ， 这 个 转换 有 个 公式 ， 这 个 方法 封装 了 这 个 公式 
public static int tocodePoint(char high, char low) 

// 根 据 代码 点 生成 char 数 组 ， 即 UTF-16 表 示 ， 如 果 code point 为 BMP 字符 ， 则 返回 的 char 
// 数 组 长 度 为 1， 如 果 为 增补 字符 ， 长 度 为 2，char [9] 为 高 代理 项 ，char [1] 为 低 代 理 项 
public static char[] tochars(int codePoint) 
// 将 代码 点 转换 为 char 数 组 ， 与 上 面 方法 类 似 ， 只 是 结果 存 入 指定 数组 dst 的 指定 位 置 index 
public static int toChars(int codePoint，char[] dst, int dstIndex) 

// 对 增补 字符 code point， 生 成 低 代理 项 
public static char lowSurrogate(int codePoint) 
// 对 增补 字符 code point， 生 成 高 代理 项 
public static char highSurrogate(int codePoint) 


4. 按 code point 处 理 char 数 组 或 序列 


Character 包 含 若 干 方法 ， 以 方便 按照 code point 处 理 char 数 组 或 序 
列 。 


返回 char 数 组 a 中 从 offset 开 始 count 个 char 包 含 的 code point 个 数 : 


public static int codePointCount(char[] a, int offset, int count ) 


比如 ， 如 下 代码 输出 为 2，char 个 数 为 3， 但 code point 为 2。 


char[] chs = new char[3]; 

chs[0] = ' 马 '，; 

Character.tocCchars(OxiFFFF, chs, 1); 
System.out.println(Character.codePointCount(chs, 0, 3)); 


除了 接受 char 数 组 ， 还 有 一 个 重 载 的 方法 接受 字符 序列 


CharSequence: 


public static int codePointCcount(CharSequence seq, int beginIndex, 
int endIndex) 


CharSequence 是 一 个 接口 ， 它 的 定义 如 下 所 示 : 


public interface CharSequence { 
int length(); 
char charAt(int index); 
CharSequence subSequence(int start, int end ) ， 
public String toString(); 


它 与 一 个 char 数 组 是 类 似 的 ， 有 length 方 法 ， 有 charAt 方 法 根据 索 
引 获取 字符 ，String 类 束 实 现 了 该 接口 。 


返回 char 数 组 或 序列 中 指定 索引 位 置 的 code point: 


public static int codePointAt(char[] a, int index) 
public static int codePointAt(char[] a, int index, int limit) 
public static int codePointAt(CharSequence seq, int index) 


如 果 指 定 索 引 位 置 为 高 代理 项 ， 下 一 个 位 置 为 低 代 理 项 ， 则 返回 
两 项 组 成 的 code point， 检 查 下 一 个 位 置 时 ， 下 一 个 位 置 要 小 于 limit， 
没 传 limit 时 ， 默 认为 alength 。 


返回 char 数 组 或 序列 中 指定 索引 位 置 之 前 的 code point: 


public static int codePointBefore(char[] a, int index) 
public static int codePointBefore(char[] a, int index, int start) 
public static int codePointBefore(CharSequence seq, int index) 


codePointAt 是 往 后 找 ， codePointBefore 是 往 前 找 ， 如 果 指 定位 置 为 
低 代 理 项 ， 且 前 一 个 位 置 为 高 代理 项 ， 则 返回 两 项 组 成 的 code point， 
今 查 前 一 个 位 置 时 ， 前 一 个 位 置 要 大 于 等 于 start， 没 传 start 了 时， 默认 为 
05° 


根据 code point 偏 移 数 计算 char 索 3 引 : 


public static int offsetByCodePoints(char[] a, int start, int count, 

int index, int codePointoffset) 
public static int offsetByCodePoints(CharSequence seq, int index, 

int codePointoffset) 


如 果 字 符 数 组 或 序列 中 没有 增补 字符 ， 返 回 值 为 
index+codePointOffset， 如 果 有 增补 字符 ， 则 会 将 codePointOffset 看 作 
code point 偏 移 ， 转 换 为 字符 偏 移 ，start 和 count 取 字符 数组 的 子 数组 。 


比如 ， 如 下 代码 : 


char[] chs = new char[3]; 
Character.toCchars(OxiFFFF, chs, 1); 
System.out.println(Character.offsetByCodePoints(chs, 0, 3, 1, 1)); 


输出 结果 为 3，index 和 codePointOffset 都 为 1， 但 第 二 个 字符 为 增补 
字符 ， 一 个 code point 偏 移 是 两 个 char 偏 移 ， 所 以 结果 为 3。 


5. 字 和 从 属性 

Unicode 在 给 每 个 字符 分 配 一 个 编号 之 外 ， 还 分 配 了 一 些 属 性 ， 
Character 类 封装 了 对 Unicode 字 符 属 性 的 检查 和 操作 ， 下 面 介绍 一 些 主 
要 的 属性 。 

获取 字符 类 型 (general category) : 


public static int getType(int codePoint) 
public static int getType(char ch) 


Unicode 给 每 个 字符 分 配 了 一 个 类 型 ， 这 个 类 型 是 非常 重要 的 ， 很 
多 其 他 检查 和 操作 都 是 基于 这 个 类 型 的 。getType 方 法 的 参数 可 以 是 int 
类 型 的 code point， 也 可 以 是 char 类 型 。char 类 型 只 能 处 理 BMP 字 符 ， 而 
int 类 型 可 以 处 理 所 有 字符 。Character 类 中 很 多 方法 都 是 既 可 以 接受 int 
类 型 ， 也 可 以 接受 char 类 型 ， 后 续 只 列 出 int 类 型 的 方法 。 返 回 值 是 int， 
表示 类 型 ，Character 类 中 定义 了 很 多 静态 常量 表示 这 些 类 型 ， 表 7-3 列 
出 了 一 些 字 符 、type 值 ， 以 及 Character 类 中 常量 的 名 称 。 


表 7-3 ”管见 字符 类 型 值 


UPPERCASE LETTER 

'al LOWERCASE LETTER 

' OTHER LETTER 

Wy DECIMAL DIGIT _ NUMBER 
SPACE_ SEPARATOR 

20 DASH PUNCTUATION 

i START_ PUNCTUATION 

23 CONNECTOR_ PUNCTUATION 

'&! OTHER PUNCTUATION 
MATH SYMBOL 

$ 26 CURRENCY SYMBOL 

检查 字符 是 否 在 Unicode 中 被 定义 : 


public static boolean isDefined(int codePoint) 


每 个 被 定义 的 字符 ， 其 getType () 返回 值 都 不 为 0， 如 果 返 回 值 为 
0， 表 示 无 定义 。 注 意 与 isValidCodePoint 的 区 别 ， 后 者 只 要 数字 不 大 于 
0x10FFFF 都 返回 true 。 


public static boolean isDigit(int codePoint) 


getType () 返回 值 为 DECIMAL_DIGIT_NUMBER 的 字符 为 数字 。 
i \`'9' 是 数字 ， 中 文 全 角 字 符 的 0 
~9 也 是 数字 。 比 如 : 


char ch = '9'; // 中 文 全 角 数 字 
System.out.println((int)ch+",，"+Character .isDigit(ch) )，; 


输出 为 : 


65305, true 
全 角 字 符 的 9，Unicode 编 号 为 66305， 它 也 是 数字 。 
检查 是 否 为 字母 (Letter) : 


public static boolean isLetter(int codePoint) 


如 果 getType () 的 返回 值 为 下 列 之 一 ， 则 为 Letter: 


UPPERCASE_LETTER 
LOWERCASE_LETTER 
TITLECASE_LETTER 
MODIFIER_LETTER 
OTHER_LETTER 


除了 TITLECASE_LETTER 和 MODIFIER_LETTER， 其 他 在 表 7-3 
中 有 示例 ， 而 这 两 个 平时 碰 到 的 也 比较 少 ， 就 不 介绍 了 。 


检查 是 否 为 字母 或 数字 : 


public static boolean isLetterOrDigit(int codePoint) 


public static boolean isAlphabetic(int codePoint) 


这 也 是 检查 是 否 为 字母 ， 与 jsLetter 的 区 别 是 : isLetter 返 回 true 时 ， 
isAlphabetic 也 必然 返回 true; 此 外 ，getType () 值 为 
LETTER_NUMBERH 时 ，isAlphabetic 也 权 回 true， 而 isLetter 返 回 false 。 

a 


LETTER_NUMBER 中 常见 的 字符 有 罗 蕊 数字 字符 ， 
如 由 由 Se | 本 '|V' © 


检查 是 否 为 空格 子 从 : 


public static boolean isSpaceChar(int codePoint ) 


getType () 值 为 SPACE_SEPARATOR, LINE _SEPARATOR 和 和 
PARACRADE _SEPARATOR 时 ， 返 回 true。 这 个 方法 其 实 并 不 和 常用， 因 
为 它 只 能 严格 匹配 空格 字符 本 号 ， 不 外 lB 匹配 实际 产生 空 x 格 效果 的 字 
性 0 o 


更 常用 的 检查 空格 的 方法 : 


public static boolean iswhitespace(int codePoint) 


\t、"\n'、 全 角 空 格 ，”' 和 半角 空格 "的 返回 值 都 为 true。 


检查 是 否 为 小 写 子 符 : 


public static boolean isLowerCase(int codePoint) 


利 见 的 小 写字 符 主 要 是 小 写 英 文字 母 a~z。 
检查 是 否 为 大 写 子 符 


public static boolean isIdeographic(int codePoint) 


大 部 分 中 文 都 返回 为 true 。 
检查 是 否 为 ISO 8859-1 编 码 中 的 控制 字符 : 


public static boolean isISOControl(int codePoint) 


我 们 在 第 2 章 介绍 过 ，0~31、127 一 159 表 示 控 制 字 符 。 


八 二 日 » 二 口译 志和 他人 
分 查 是 否 可 作为 Java 标 识 符 的 第 一 个 字符 : 
public static boolean isJavaIdentifierStart(int codePoint) 


Java 标 识 符 是 Java 中 的 变量 名 、 画 数 名 、 类 名 等 ， 字 母 
(Alphabetic) 、 美 元 符号 ($) 、 下 夯 线 (_) 可 作为 Java 标 识 符 的 第 
一 个 字符 ， 但 数字 字符 不 可 以 。 


伶 查 是 否 可 作为 Java 标 识 符 的 中 间 字 符 ; 


public static boolean isJavaIdentifierPart(int codePoint) 


相 比 isJavaIdentifierStart， 主 要 多 了 数字 字符 ，Java 标 识 符 的 中 间 字 
符 可 以 包含 数字 。 


人 纺 查 是 否 为 镜像 (mirrowed) 字符 : 


public static boolean isMirrored(int codePoint ) 


常见 镜像 字符 有 “() 、{}、<>、[]， 都 有 对 应 的 镜像 。 
6. 字 符 转换 


Unicode 除 了 规定 字符 属性 外 ， 对 有 大 小 写 对 应 的 字符 ， 还 规定 了 
其 对 应 的 大 小 写 ， 对 有 数值 舍 义 的 字符 ， 也 规定 了 其 数值 。 


我 们 先 来 看 大 小 写 ，Character 有 两 个 静态 方法 ， 对 字符 进行 大 小 
写 转 换 : 


public static int toLowerCase(int codePoint ) 
public static int toUpperCase(int codePoint ) 


这 两 个 方法 主要 针对 英文 字符 a~z 和 A~Z， 例 如 : toLowerCase 
(A') 返回 'a，toUpper-Case (z') 返回 'Z'。 


返回 一 个 字符 表示 的 数值 : 


public static int getNumericValue(int codePoint) 


字符 '0'~'9' 返 回 数值 0~~9， 对 于 字符 a~z， 无 论 古 小 写字 符 还 是 大 
写 子 符 ， 无 论 是 普通 美文 还 是 中 文 全 角 ， 数 值 结果 都 钙 10~~35。 例 
如 ， 如 下 代码 的 输出 结果 是 一 样 的 ， 都 是 10。 


System.out.printlLn(Character .getNumericvValue('A'))， // 全 角 大 写 A 
System.out.printin(Character.getNumericValue('A')); 
System.out.printlLn(Character .getNumericValue('a')); // 全 和 角 小 写 a 
System.out.printin(Character .getNumericValue('a')); 


返回 按 给 定 进 制 表示 的 数值 : 


public static int digit(int codePoint, int radix) 


radix 表 示 进 制 ， 和 常见 的 有 二 进 制 、 八 进 制 、 十 进 制 、 十 六 进 制 ， 
计算 方式 与 get-NumericValue 类 似 ， 只 是 会 检查 有 效 性 ， 数 值 需要 小 于 
radix， 如 果 无 效 ， 返 回 -1。 例如: digit (F'"，16) 返回 15， 是 有 效 的 ; 
但 digit ('G'，16) 就 无 效 ， 返 回 -1。 


返回 给 定数 值 的 字符 形式 : 
public static char forDigit(int digit, int radix) 


与 digit (int codePoint，int radix) 相 比 ， 进 行 相反 转换 ， 如 果 数 字 
无 效 ， 返 回 \0'。 例 如 ，CharacterforDigit (15，16) 返回 'F'。 


与 Integer 类 似 ，Character 也 有 按 字 节 翻转 : 


public static char reverseBytes(char ch) 


例如 ， 翻 转子 符 0x1234: 


System.out.printlin(Integer.toHexString( 
Character .reverseBytes( (char)0Ox1234))); 


输出 为 3412。 


至 此 ，Characer 类 就 介绍 完了 ， 它 在 Unicode 字 符 级 别 〈 而 非 char 级 
别 ) 封 妆 了 字符 的 各 种 操作 ， 通过 将 字符 处 理 的 细 和 交 给 Character 
类 ， 其 他 类 就 可 以 在 更 高 的 层次 上 处 理 文本 了 。 


7.2 剖析 String 

字符 串 操作 是 计算 机 程序 中 最 常见 的 操作 之 一 。Java 中 处 理 字符 
的 主要 类 是 String 和 StringBuilder， 本 节 介 绍 String。 先 介绍 基本 用 法 ， 
然后 介绍 实现 原理 ， 随 后 介绍 编码 转换 ， 分 析 String 的 不 可 变性 、 常 量 
字符 串 、hashCode 和 正则 表达 式 。 
7.2.1 基本 用 法 


大 字符 串 的 基本 使 用 是 比较 简单 直接 的 。 可 以 通过 稍 量 定义 String 变 
里 : 


String name = " 老 马 说 编程 " ; 


也 可 以 通过 new 创 建 String 变 量 : 


String name = new String(" 老 马 说 编程 ") ; 


String 可 以 直接 使 用 和 += 运 算 待 ， 如 : 


String name = " 老 马 " 

name+= "说 编程 " ; 

String descritpion = "探索 编程 本 质 " ; 
System.out,.println(name+descritpion) 


输出 为 : 


老 马 说 编程 , 探索 编程 本 质 


String 类 包括 很 多 方法 ， 以 方便 操作 字符 串 ， 比 如 : 


public boolean isEmpty() // 判 断 字 符 串 是 否 为 空 
public int length() // 获 取 字 符 串 长 度 
public String substring(int beginIndex) // 取 子 字符 串 
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public String substring(int beginIndex，int endIndex) // 取 子 字 符 串 
public int index0f(int ch) // 查 找 字 符 ， 返回 第 一 个 找到 的 索引 位 置 ， 没 找到 返回 -1 
public int indexof(String str) // 查 找 子 串 ， 返 回 第 一 个 找到 的 索引 位 置 ， 没 找到 返 
public :int lastIndexof(int ch) // 从 后 面 查找 字符 
public int lastIndexof(String str) // 从 后 面 查找 子 字 符 串 
public boolean contains(CharSequence s) // 判 断 字 符 串 中 是 否 包含 指 定 的 字符 序列 
public boolean startswith(String prefix) // 判 断 字符 串 是 否 以 给 定子 字符 串 开 头 
public boolean endswith(String suffix) // 判 断 字 符 串 是 否 以 给 定子 字符 串 结尾 
public boolean equals(0bject an0bject) // 与 其 他 字符 串 比 较 ， 看 内 容 是 否 相同 
public boolean equalsIgnoreCase(String anotherSstring) // 忽 略 大 小 写 比 较 是 否 相 同 
public int compareTo(String anotherstring) // 比 较 字 符 串 大 小 
public int compareToIgnoreCase(String str) // 忽 略 大 小 写 比较 
public String toUpperCase() // 所 有 字符 转换 为 大 写字 符 ， 返 蕊 
public String toLowerCase() // 所 有 字符 转换 为 小 写字 符 ， 返 下 
public String concat(String str) // 字 符 串 连接 ， 返 回 当 前 字符 串 和 参数 字符 捉 合并 结果 
public string replace(char oldChar， char newChar) // 字 符 串 替换 ， 替 换 单 个 字符 
// 字 符 串 替 换 ， 替 换 字符 序列 ， 返 回 新 字符 串 ， 原 字符 串 不 变 

public String ranlacetChaseguleniea target, CharSequence replacement) 
public String trim() // 删 掉 开 头 和 结尾 的 空格 ， 返 回 新 字符 串 ， 原 字符 串 不 变 
public String[] split(String regex) // 分 隔 字符 串 ， 返 回 分 隔 后 的 子 字符 串 数 组 
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看 个 String 的 价 单 例 和 于 ， 按 逗号 分 隔 "hello，world"': 


String str = "hello,world"; 
String[] arr = str.split(","); 


arr[0] 为 "hello"，arr[1] 为 "world"。 


Sing 的 操作 大 多 简单 直接 ， 不 再 费 进 。 从 调用 者 的 角度 了 解 了 
String 的 基本 用 法 ， 下 面 我 们 进一步 来 理解 String 的 内 部 (代码 基于 Java 
7) 。 


7.2.2” 走 进 String 内 部 
String 类 内 部 用 一 个 字符 数组 表示 字符 串 ， 实 例 变 量 定义 为 : 
private final char value[]; 


String 有 两 个 构造 方法 ， 可 以 根据 char 数 组 创建 String 变 量 : 


public String(char value[]) 
public String(char value[], int offset, int count) 


需要 说 明 的 是 ，String 会 根据 参数 新 创建 一 个 数组 ， 并 复制 内 容 ， 
而 不 会 直接 用 参数 中 的 字符 数组 。String 中 的 大 部 分 方法 内 部 也 都 是 操 
作 的 这 个 字符 数组 。 比 如 : 


1) length () 方法 返回 的 是 这 个 数组 的 长 度 。 


2) substring () 方法 是 根据 参数 ， 调 用 构造 方法 String (char 
value[]，int offset，int count) 新 建 了 一 个 字符 串 。 


3) indexOf () 方法 查找 字符 或 子 字 符 串 时 是 在 这 个 数组 中 进行 查 
所 


这 些 方法 的 实现 大 多 比较 直接 ， 不 再 痪 述 。 


String 中 还 有 一 些 方法 ， 与 这 个 char 数 组 有 天 : 


public char charAt(int index) // 返 回 指定 索引 位 置 的 char 

// 返 回 字符 串 对 应 的 char 数 组 ， 注 意 ， 返 回 的 是 一 个 复制 后 的 数组 ， 而 不 是 原 数组 
public char[] toCharArray() 
// 将 char 数 组 中 指定 范围 的 字符 复制 入 目标 数组 指定 位 
public void getcChars(int srcBegin, int srcEnd，char dst[], int dstBegin) 


与 Character 类 似 ，String 也 提供 了 一 些 方法 ， 按 代码 点 对 字符 串 进 
行 处 理 ， 具 体 不 再 袭 述 。 


public int codePointAt(int index) 

public int codePointBefore(int index) 

public int codePointCount(int beginIndex, int endIndex) 
public int offsetByCodePoints(int index, int codePointoffset ) 


7.2.3 ”编码 转换 


String 内 部 是 按 UTEF-16BE 处 理 字 符 的 ， 对 BMP 字符 ， 使 用 一 个 
char， 两 个 字 方 ， 对 于 增补 字符 ， 使 用 两 个 char， 四 个 字 市 。 我 们 在 第 
2.3 下 介绍 过 各 种 编码 ， 不 同 编码 可 能 用 于 不 同 的 字符 集 ， 使 用 不 同 的 
字 下 数目， 以 及 不 同 的 二 进 制 表示 。 如 何 处 理 这 些 不 同 的 编码 呢 ? 这 
些 编码 与 Java 内 部 表示 之 间 如 何 相互 转换 呢 ? 


Java 使 用 Charset 类 表示 各 种 编码 ， 它 有 两 个 常用 静态 方法 : 


public static Charset defaultCcharset() 
public static Charset forName(String charsetName ) 


第 一 个 方法 返回 系统 的 默认 编码 ， 比 如 ， 在 笔者 的 计算 机 中 ， 执 
行 如 下 语句 : 


System.out.printlin(Charset.defaultCharset().name()); 


输出 为 UTF-8。 


第 二 个 方法 返回 给 定编 码 名 称 的 Charset 对 象 ， 与 我 们 在 2.3 节 介绍 
的 编码 相对 应 ， 其 charset 名 称 可 以 是 US-ASCII、ISO-8859-1、windows- 
1252、GB2312、GBK、GB18030、Big5、UTF-8 等 ， 比 如 : 


Charset charset = Charset.forName("GB18030"); 


String 类 提供 了 如 下 方法 ， 返 回 字符 串 按 给 定编 码 的 字 世 表示 : 


public byte[] getBytes() 
public byte[] getBytes(String charsetName) 
public byte[] getBytes(Charset charset) 


第 一 个 方法 没有 编码 参数 ， 使 用 系统 默认 编码 ， 第 二 个 方法 参 关 
为 编码 名 称 ; 第 三 个 方法 参数 为 Charset 。 


String 类 有 如 下 构造 方法 ， 可 以 根据 字 节 和 编码 创建 字符 串 ， 也 整 
征 说 ， 根 据 给 定编 码 的 字 节 表示 ， 创 建 Java 的 内 部 表示 。 


public String(byte bytes[], int offset, int length, String charsetName ) 
public String(byte bytes[], Charset charset) 


除了 通过 String 中 的 方法 进行 编码 转换 ，Charset 类 中 也 有 一 些 方法 
进行 编码 /解码 ， 本 书 就 不 介绍 了 人 。 重 要 的 是 认识 到 ，Java 的 内 部 表示 
与 各 种 编码 是 不 同 的 ， 得 可 以 相互 转换 。 


7.2.4 不 可 变性 


与 包 闭 类 类 似 ，String 类 也 是 不 可 变 类 ， 即 对 象 一 旦 创建 ， 就 没有 
办 法 修改 了 。String 类 也 声明 为 了 final， 不 能 被 继承 ， 内 部 char 数 组 
value 也 是 final 的 ， 初 始 化 后 束 不 能 再 变 了 。 


String 类 中 提供 了 很 多 看 似 修改 的 方法 ， 其 实 是 通过 创建 新 的 
| ， 原 来 的 String 对 象 不 会 被 修改 。 比 如 ，concat () 
法 的 代码 : 


public String concat(String str) { 
int otherLen = str.length(); 
if(otherLen == 0) { 
return this,; 
} 


int len = value.length,; 

char buf[] = Arrays.copyof(value, len + otherLen); 
str.getchars(buf, len); 

return new String(buf, true); 


通过 Arrays.copyO{ 方 法 创建 了 一 块 新 的 字符 数组 ， 复 制 原 内 容 ， 
然后 通过 new 创 建 了 一 个 新 的 String， 最 后 一 行 调用 的 是 String 的 男 一 个 
构造 方法 ， 其 定义 为 : 


String(char[] value, boolean share) { 
//assert share : "unshared not supported"; 
this.value = Value， 


这 是 一 个 非 公开 的 构造 方法 ， 直 接 使 用 传递 过 来 的 数组 作为 内 部 
数组 。 天 于 Arrays 类 ， 我 们 在 7.4 世 介绍。 


与 包装 类 类 似 ， 定 义 为 不 可 变 类 ， 程 序 可 以 更 为 简单 、 安 全 、 容 
易 理 解 。 但 如 果 频 繁 修改 字符 串 ， 而 每 次 修改 都 新 建 一 个 字符 串 ， 那 
么 性 能 太 低 ， 这 时 ， 应 该 考虑 Java 中 的 另 两 个 类 StringBuilder 和 
StringBuffer ° 


Java 中 的 字符 串 常 量 是 非常 特殊 的 ， 除 了 可 以 直接 赋值 给 String 变 
量 外 ， 它 目 己 整 像 一 个 String 类 型 的 对 象 ， 可 以 直接 调用 String 的 各 种 
方法 。 我 们 来 看 代码 : 


System.out.println(" 老 马 说 编程 " .length()); 
System.out.print1Ln(" 老 马 说 编程 ".contains(" 老 马 " ) ) ; 
System.out.printlLn(" 老 马 说 编程 " .indexof(" 编 程 ") ) ; 


实际 上 ， 量 就 是 String 类 型 的 对 象 ， 在 内 存 中， 它们 被 放 在 
一 个 基准 好 方 ， ee 量 池 ， 它 保存 所 有 的 常量 字 

符 串 ， 每 个 常量 只 会 保存 一 份 ， 被 所 有 使 用 者 共享 。 当 通过 常量 的 形 
直人 月 一 个 符 昌 的 村 候 ， 全 用 的 就 是 常量 池 中 的 那个 对 应 的 String 类 
型 的 对 象 。 


比如 以 下 代码 : 


String namel =“" 老 马 说 编程 "， 
String name2 =“" 老 马 说 编程 "， 


System.out.println(name1==name2); 


输出 为 true。 为 什么 呢 ? 可 以 认为 ，" 老 马 说 编程 "在 和 量 池 中 有 一 
个 对 应 的 String 类 型 的 对 象 ， 我 们 假定 名 称 为 aoma， 上 面 的 代码 实际 
上 束 类 似 于 : 


String Laoma = new String(new char[]{' 老 ', ' 马 ', ' 说 ', ' 编 ', ' 程 '})， 
String namel1 laoma; 

String name2 = laoma; 

System.out,.println(name1==name2) ， 


实际 上 只 \ 有 一 个 String 对 象 ， 三 个 变量 都 指 癌 这 个 对 象 ， 
namel==name2 也 了 驶 不 言 而 喻 了 。 


需要 注意 的 是 ， 如 果 不 是 通过 常量 直接 赋值 ， 而 是 通过 new 创 建 ， 
== 就 不 会 返回 true 『 ， 看 下 面 的 代码 : 


String name1 = new String(" 老 马 说 编程 ")，; 
String name2 = new String(" 老 马 说 编程 "); 
System.out,.println(name1==name2 ) ， 


输出 为 false。 为 什么 呢 ? 上 面 代码 类 似 于 : 


String laoma = new String(new char[]{' 老 ', ' 马 ', ' 说 ', ' 编 ', ' 程 '}); 
String name1 = new String(laoma),; 
String name2 = new String(laoma); 
System.out.println(name1==name2 ) ， 


String 类 中 以 String 为 参数 的 构造 方法 代码 如 下 : 


public String(String original) { 
this.value = original.value,; 
this.hash = original.hash; 


} 


hash 是 String 类 中 另 一 个 实例 变量 ， 表 示 缓 存 的 hashCode 值 。 


可 以 看 出 ，name1 和 name2 指 回 两 个 不 同 的 String 对 象 ， 只 是 这 两 个 
对 象 内 部 的 value 值 指向 相同 的 char 数 组 。 其 内 存 布局 如 图 7-1 所 示 。 


namel!=name2 
namel.equals(name2)==true 
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图 7-1 两 个 String 对 象 的 内 存 布局 


所 以 ，namel==name2 不 成 立 ， 但 namel.equals (name2) 是 true。 


7.2.6 hashCode 


7.2.5 广 中 提 人 到 hash 这 个 实例 变量 ， 它 的 定义 如 下 : 


private int hash; //Default to 0 


hash 变 量 绥 存 了 hashCode 方 法 的 值 ， 也 整 古 说 ， 第 一 次 调用 
hashCode 方 法 的 时 候 ， 会 把 结 末 保存 在 hash 这 个 变量 中 ， 以 后 再 调用 束 
直接 返回 保存 的 值 。 


我 们 来 看 下 String 类 的 hashCode 方 法 ， 代 码 如 下 : 


public int hashcode() { 
int h = hash; 
if(h == 0 && value.length > 0) { 
char val[] = value; 
for(int i = 0; i < value.length; i++) { 
h=31* h + val[il]; 


} 
hash = h; 


return h; 


} 


如 果 绥 存 的 hash 不 为 0， 就 直 返 返回 了 ， 奋 则 根据 字符 数组 中 的 内 
容 计 算 hash， 计 算 方 法 是 : 


s[0]*31^(n-1) + s[1]*31^(n-2) + ... + S[n-1] 


s 表 示 子 符 串 ，s[0] 表 示 第 一 个 字符 ，n 表 示 字 符 捉 长 度 ，s[0]*31 人 ^ 
(n-1) 表示 31 的 (n-1) 次 方 再 乘 以 第 一 个 字符 的 值 。 


为 什么 要 用 这 个 计算 方法 呢 ? 使 用 这 个 式 子 ， 可 以 让 hash 值 与 每 个 
字符 的 值 有 关 ， 也 与 每 个 字符 的 位 置 有 关 ， 位 置 i (i>=1) 的 因素 通过 
31 的 (n-i) 次 方 表示 。 使 用 31 大 致 是 因为 两 个 原因 : 一 方面 可 以 产生 
更 分 散 的 散 列 ， 即 不 同 字符 串 hash 值 也 一 般 不 同 ， 另 一 方面 计算 效率 比 
较 高 ，31*h 与 32*h-h 即 (h<<5) -h 等 价 ， 可 以 用 更 高 效率 的 移 位 和 减法 
操作 代替 乘法 操作 。 


在 Java 中 ， 普 裔 采用 以 上 思路 来 实现 hashCode 。 


727 焉 则 素 达 趟 


String 类 中 ， 有 一 些 方 法 接受 的 不 是 普通 的 字符 串 参 数 ， 而 是 正则 
表达 式 。 什 么 是 正则 表达 式 呢 ? 正则 表达 式 可 以 理解 为 一 个 字符 串 ， 
但 表达 的 是 一 个 规则 ， 一 般 用 于 文本 的 匹配 、 查找 、 替 换 等 。 正 则 表 
达 式 具有 丰富 和 强大 的 功能 ， 是 一 个 比较 大 的 话题 ， 我 们 在 第 25 章 单 


独 介绍 。 


Java 中 有 专门 的 类 (如 Pattem 和 Matcher) 用 于 正则 表达 式 ， 但 对 
于 简单 的 情况 ，String 类 提供 了 更 为 简洁 的 操作 ，String 中 接受 正则 表 
达 式 的 方法 有 : 


豆 忆 Ai 


public String[] split(String regex)  // 分 隔 字符 串 
public boolean matches(String regex) // 检 查 是 否 匹配 

public String replaceFirst(String regex，String replacement) // 字 符 串 替换 
public String replaceAll(String regex，String replacement) // 字 符 串 替换 


至 此 ， 关 于 String 的 用 法 、 原 理 和 特性 等 基本 介绍 完了 。 天 于 
String 的 实现 原理 ， 值 得 了 解 的 是 ，Java 9 对 String 的 实现 进行 了 优化 ， 
它 的 内 部 不 是 char 数 组 ， 而 是 byte 数 组 ， 如 果 字 从 都 是 ASCII 字 符 ， 它 
ee 六 字符 ， 而 不 用 UTF-16BE 编 码 ， 节 省 内 
了 O 


7.3 剖析 StringBuilder 


7.2.4 提 到 ， 如 果 字 符 串 修改 操作 比较 频繁 ， 应 该 采用 
StringBuilder 和 StringBuffer 类 ， 这 两 个 类 的 方法 基本 是 完全 一 样 的 ， 它 
们 的 实现 代码 也 几乎 一 样 ， 唯 一 的 不 同 就 在 于 StringBuffer 类 是 线程 安 
全 的 ， 而 StringBuilder 类 不 是 。 


关于 线程 的 概念 ， 我 们 到 第 15 章 再 介绍 。 这 里 需要 知道 的 就 是 ， 
线程 安全 是 有 成 本 的 ， 影 响 性 能 ， 而 字符 串 对 象 及 操作 大 部 分 情况 下 
不 存在 线程 安全 问题 ， 适 合 使 用 String-Builder 类 。 所 以 ， 本 太 束 只 讨 
论 StringBuilder 类 ， 包 括 基 本 用 法 和 基本 原理 。 


Z31 二 本 用 全 
StringBuilder 的 基本 用 法 很 向 单 。 创 建 StringBuilder 对 象 : 
StringBuilder sb = new StringBuilder(); 
通过 append 方 法 添加 字符 串 : 


sb ,append(" 老 马 说 编程 ") ; 
sb ,append(", 探索 编程 本 质 " ) ; 


通过 toString 方 法 获取 构建 后 的 字符 串 : 
System.out.println(sb.toSstring()); 
输出 为 : 


老 马 说 编程 , 探索 编程 本 质 


大 部 分 情况 ， 使 用 束 这 么 简单 ， 通 过 new 新 建 StringBuilder 对 象 ， 
， 然 后 通过 toString 方 法 获取 构建 完成 的 字 


付 


7.3.2 ”基本 实现 原理 


StringBuilder 类 是 怎么 实现 的 呢 ? 我 们 来 看 下 它 的 内 部 组 成 ， 以 及 
一 些 主要 方法 的 实现 ， 代 码 基 于 Java 7。 与 String 类 似 ，StringBuilder 类 
也 封装 了 一 个 字符 数组 ， 定 义 如 下 : 


char[] value 


与 String 不 同 ， 它 不 是 final 的 ， 可 以 修改 。 另 外 ， 与 String 不 同 ， 
字符 数组 中 不 一 定 所 有 位 置 都 已 经 被 使 用 ， 它 有 一 个 实例 变量 ， 表 示 
数组 中 已 经 使 用 的 字符 个 数 ， 定 义 如 下 : 


int count ; 


StringBuilder 继 承 目 AbstractStringBuilder， 它 的 默认 构造 方法 是 : 


public StringBuilder() { 
super (16); 


调用 父 类 的 构造 方法 ， 父 类 对 应 的 构造 方法 是 : 


AbstractStringBuilder(int capacity) { 
value = new char[capacity]; 


} 


也 就 是 说 ，new StringBuilder () 代码 内 部 会 创建 一 个 长 度 为 16 的 
字符 数组 ，count 的 默认 值 为 0。 来 看 append 方 法 的 代码: 


public AbstractStringBuilder append(String str) { 
if(str == null) str = "null"; 
int len = Str. length()， 


ensureCapacityInternal(count + len); 
str.getchars(0, len, value, count),; 
count += lJen; 
return this; 


append 会 直接 复制 字符 到 内 部 的 字符 数组 中 ， 如 果 字 符 数 组 长 度 
不 够 ， 会 进行 扩展 ， 实 际 使 用 的 长 度 用 count 体 现 。 有 具体 来 说 ， 
ensureCapacityInternal (count+len) 会 确保 数组 的 长 度 足 以 容纳 新 添加 
的 字符 ，strgetChars 会 复制 新 添加 的 字符 到 字符 数组 中 ，count+=len 会 
增加 实际 使 用 的 长 度 。 


ensureCapacityInternal 的 代码 如 下 : 


private void ensureCapacityInternal(int minimumCapacity) { 
//overflow-conscious code 
if(minimumCapacity - value.length > 0) 
expandCapacity(minimumCapacity); 


如 果 字 符 数 组 的 长 度 小 于 需要 的 长 度 ， 则 调用 expandCapacity 进 行 
扩展 ， 其 代码 为 : 


void expandCapacity(int minimumCapacity) { 
int newCapacity = value.length * 2 + 2,; 
if(newCapacity - minimumCapacity < 0) 
newCapacity = minimumCapacity; 
If(newCapacity < 0) { 
if (minimumCapacity < 0) //overflow 
throw new OutofMemoryError(); 
newCapacity = Integer .MAX_ VALUE; 


value = Arrays.copyof(value, newCapacity); 


} 


扩展 的 逻辑 是 : 分 配 一 个 足够 长 度 的 新 数组 ， 然 后 将 原 内 容 复制 
到 这 个 新 数组 中 ， 最 后 让 内 部 的 字符 数组 指向 这 个 新 数组 ， 这 个 逻辑 
主要 靠 下 面 的 代码 实现 


value = Arrays.copyof(value, newCapacity); 


关于 类 Arrays， 我 们 下 一 世 介 绍 ， 这 里 主要 看 下 newCapacity 是 怎 
么 算出 来 的 。 参数 minimumCapacity 表 示 需 要 的 最 小 长 度 ， 需要 多 少 分 
配 多 少 不 束 行 了 吗 ? 不 行 ， 因 为 那 束 跟 String 一 样 了 ， 每 append 一 次 ， 
都 会 进行 一 次 内 存 分 配 ， 效 率 低下 。 这 里 的 扩展 策略 是 跟 当 前 长 度 相 
关 的 ， 当 前 长 度 乘 以 2， 再 加 上 2， 如 果 这 个 长 度 不 够 最 小 需要 的 长 
上 度 ， 才 用 minimumCapacity 。 


比如 ， 默 认 长 度 为 16， 长 度 不 够 时 ， 会 先 扩展 到 16*2+2 即 34， 然 
后 扩展 到 34*2+2 即 70， 然 后 是 70*2+2 即 142， 这 是 一 种 指数 扩展 策 
略 。 为 什么 要 加 2? 这 样 ， 在 原 长 度 为 0 时 也 可 以 一 样 工作 。 


为 什么 要 这 么 扩展 昵 ? 这 是 一 种 折 中 策略 ， 一 方面 要 减少 内 存 分 
配 的 次 数 ， 另 一 方面 要 避免 空间 浪费 。 在 不 知道 最 终 需 要 多 长 的 情况 
小 ， 指 数 扩 展 症 一 种 常见 的 策略 ， 放 泛 应 用 于 各 种 内 存 分 配 相 天 的 计 
算 机 程序 中 。 不过， 如 果 预 完 就 知道 需要 多 长 ， 那 么 可 以 调用 
StringBuilder 的 男 外 一 个 构造 方法 : 


public StringBuilder(int capacity) 


字符 串 构建 完 后 ， 我 们 来 看 toString 方 法 的 代码 : 


public String toString() { 
//Create a copy, don't share the array 
return new String(value, 0, count); 


} 


基于 内 部 数组 新 建 了 一 个 String。 注 意 ， 这 个 String 构 造 方 法 不 会 
直接 用 value 数 组 ， 而 会 狐 建 一 个 ， 以 保证 String 的 不 可 变性 。 


除了 append 和 toString 方 法 ，StringBuilder 示 有 很 多 其 他 方法 ， 包 
括 更 多 构造 方法 、 更 多 append 方 法 、 插 和 人 入、 删除、 替换、 翻转、 长 度 
有 天 的 方法 ， 限 于 篇 幅 ， 束 不 一 一 列举 了 。 主 要 看 下 插入 方法 。 在 指 
定 索 引 offset 处 插入 字符 串 str: 


public StringBuilder insert(int offset，String str) 


原来 的 字符 后 移 ，offset 为 0 表示 在 开头 插 ， 为 length () 表示 在 结 
尾 插 ， 比 如 : 


StringBuilder sb = new StringBuilder(); 
sb.append(" 老 马 说 编程 " ) ; 

sb.insert(0,， "关注 ")， 

sb.insert(sb.length(),，" 老 马 和 你 一 起 探索 编程 本 质 " ) ; 
sb.insert(7, ","); 
System.out.println(sb.tostring()); 


输出 为 : 


关注 老 马 说 编程 , 老 马 和 你 一 起 探索 编程 本 质 


了 解 了 用 法 ， 下 面 来 看 insert 的 实现 代码 : 


public AbstractStringBuilder insert(int offset, String str) { 

if((offset < 0) || (offset > length())) 

throw new StringIndexOutofBoundsException(offset); 
if(str == null) 

str = "null"; 
int len = Str. length()， 
ensureCapacityInternal(count + len); 
System.arraycopy(value, offset, value, offset + len, count - offset); 
str.getchars(value, offset); 
count += len; 
return this; 


这 个 实现 思路 是 : 在 确保 有 足够 长 度 后 ， 首 先 将 原 数组 中 offset 开 
始 的 内 容 癌 后 挪动 n 个 位 置 ，n 为 待 插入 字符 串 的 长 度 ， 然 后 将 待 插入 
字符 串 复 制 进 offset 位 置 。 


挪动 位 置 调用 了 System.arraycopy () 方法 ， 这 是 个 比较 常用 的 方 
法 ， 它 的 声明 如 下 : 


public static native void arraycopy(Object src, int srcPpos, 
Object dest, int destPos, int length); 


将 数组 src 中 srcPos 开 始 的 length 个 元 素 复 制 到 数组 dest 中 destPos 
处 。 这 个 方法 有 个 优点 : 即使 sc 和 dest 是 同一 个 数组 ， 它 也 可 以 正确 


处 理 。 比 如 下 面 的 代码 : 


int[] arr = new int[]{1,2,3,4}; 
System.arraycopy(arr, 1, arr, 0, 3); 
System.out.println(arr[0]+","+arr[1i]+","+arr[2]); 


这 里 ，src 和 dest 都 是 arr，srcPos 为 1，destPos 为 0，length 为 3， 表 
示 将 第 二 个 元 素 开 始 的 三 个 元 素 移 到 开头 ， 所 以 输出 为 : 


arraycopy 的 声明 有 个 修饰 符 native， 表 示 它 的 实现 是 通过 Java 本 地 
接口 实现 的 。Java 本 地 接口 是 Java 提 供 的 一 种 技术 ， 用 于 在 Java 中 调用 
非 Java 实 现 的 代码 ， 实 际 上 ，array-copy 是 用 C++ 语言 实现 的 。 为 什么 
要 用 C++ 语言 实现 呢 ? 因为 这 个 功能 非常 种 用， 而 C++ 的 实现 效率 要 


远 高 于 Java。 
7.3.3 ”String 的 + 和 += 运 算 符 


Javar ， String 可 以 直接 使 用 + 和 += 运 算 符 ， 这 是 Java 编 译 右 提供 
的 支持 ， 背 后 ，Java 编 译 咽 一 般 会 生成 StringBuilder，+ 和 += 操作 会 转 
换 为 append 。 比 如， 如 下 代码 : 


String hello = "hello"; 
hello+=",world"; 
System.out.println(hello); 


育 后 ，Java 编 译 亏 一 般 会 转换 为 : 


StringBuilder hello = new StringBuilder("hello"); 
hello.append(",world") 
System.out.println(hello.tostring()); 


既然 直接 使 用 + 和 += 就 相当 于 使 用 StringBuilder 和 append， 那 还 有 
什么 必要 直接 使 用 StringBuilder 呢 ? 在 简单 的 情况 下 ， 确 实 没 必 要 。 不 
过 ， 在 稍微 复杂 的 情况 下 ，Java 编 译 属 可 能 没有 那么 智能 ， 它 可 能 会 


生成 过 多 的 SingBuilder 尤其 是 在 有 循环 的 情况 下 ， 比 如 ， 如 下 代 
码 : 


String hello = "hello"; 
for(int i=0;i<3;i++){ 
hello+=",world"; 


System.out.println(hello); 


Java 编 译 事 转换 后 的 代码 大 致 如 下 所 示 : 


String hello = "hello"; 

for(int i=0;i<3;i++){ 
StringBuilder sb = new StringBuilder(hello); 
sb.append(",world"); 
hello = Sb,toString()， 


} 
System.out.println(hello); 


在 循环 内 部 ， 每 一 次 += 操 作 ， 痢 会 生成 一 个 StringBuilder 。 


所 以 ， 对 于 简单 的 情况 ， 可 以 直接 使 用 String 的 + 和 +=， 对 于 复杂 
的 情况 ， 尤 其 是 有 循环 的 时 候 ， 应 该 直接 使 用 StringBuilder 。 


7.4 剖析 Arrays 


数组 是 存储 多 个 同类 型 元 素 的 基本 数据 结构 ， 数 组 中 的 元 素 在 内 
存 连续 存放 ， 可 以 通过 数组 下 标 直 接 定位 任意 元 素 ， 相 比 在 后 续 章 世 
介绍 的 其 他 容器 而 言 效率 非常 高 。 


数组 操作 是 计算 机 程序 中 的 常见 基 本 操作 。Java 中 有 一 个 类 
Arrays， 包 含 一 些 对 数组 操作 的 静态 方法 ， 本 市 主要 束 来 讨论 这 些 方 
法 。 首 先 介 绍 怎么 用 ， 然 后 介绍 它们 的 实现 原理 。 学 习 Arrays 的 用 
法 ， 束 可 以 “避免 重 狐 发 明 轮 子 ”， 直 接 使 用 ， 学 习 它 的 实现 原理 ， 就 
可 以 在 需要 的 时 候 上 自己 实现 它 不 具备 的 功能 。 


7.4.1 用 法 


Arrays 类 中 有 很 多 方法 ， 我 们 主要 介绍 toString、 排 序 、 查 找 ， 对 
于 一 些 其 他 方法 ， 如 复制 、 比 较 、 批 量 设置 值 和 计算 哈 希 值 等 ， 我 们 
也 进行 简单 介绍 。 


1.toString 


Arrays 的 toString () 方法 可 以 方便 地 输出 一 个 数组 的 字符 串 形 
式 ， 以 便 香 看 。 它 有 9 个 重 载 的 方法 ， 包 括 8 个 基本 类 型 数组 和 1 个 对 象 
类 型 数组 ， 下 面 列 举 两 个 : 


public static String toString(int[] a) 
public static String toString(Object[] a) 


例如 : 


int[] arr = {9,8,3,4}; 
System,.out,println(Arrays.toString(arr))， 
String[] StrArr = {"hello", "world"}; 
System,.out,println(Arrays.toString(StrArr ) )， 


输出 为 : 


[9, 8, 3, 4] 
[hello, world] 


如 果 不 使 用 Arrays.toString 方 法 ， 直 接 输 出 数组 目 身 ， 即 代码 改 


YY 


int[] arr = {9,8,3,4}; 
System,.out.println(arr); 

String[] strArr = {"hello", "world"}; 
System,.out,.println(strArr); 


则 输出 会 变 为 如 下 所 示 : 


[I@1224b90 
[Ljava.1lang.SsString;@728edb84 


这 个 输出 就 难以 阅读 了 ，@ 后 面 的 数字 表示 的 是 内 存 的 地 址 。 
2. 排 序 


排序 是 一 种 非常 常见 的 操作 。 同 toString 一 样 ， 对 每 种 基本 类 型 的 
数组 ，Arrays 都 有 sort 方 法 (boolean 除 外 ) ， 例 如 : 


public static void sort(int[] a) 
public static void sort(double[] a) 


排序 按照 从 小 到 大 升序 排列 ， 例 如 : 


int[] arr = {4, 9, 3, 6, 10}; 
Arrays.sort(arr); 
System,.out.println(Arrays.toSstring(arr)); 


输出 为 : 


[3, 4, 6, 9, 10] 


数组 已 经 排 好 序 了 。 


除了 基本 类 型 ，sort 还 可 以 直接 接受 对 象 类 型 ， 但 对 象 需要 实现 
Comparable 接 口 。 


public static void sort(Object[] ay) 
public static void sort(Object[] a, int fromIndex, int toIndex) 


我 们 看 个 String 数 组 的 例子 : 


String[] arr = {"hello","world", "Break","abc"}; 
Arrays.sort(arr); 
System,.out,println(Arrays.toString(arr))， 


输出 为 : 


[Break, abc, hello, world] 


"Break" 之 所 以 排 在 最 前 面 ， 是 因为 大 写字 母 的 ASCII 码 比 小 写字 
母 都 小 。 那 如 果 排 序 的 时 候 希 望 忽略 大 小 写 呢 ?sort 还 有 另外 两 个 重 载 
方法 ， 可 以 接受 一 个 比较 器 作为 参数 : 


public static <T> void sort(T[] a, Comparator<? super T> c) 
public static <T> void sort(T[] a, int fromIndex, int toIndex, 
Comparator<? super T> c) 


方法 声明 中 的 T 表 示 泛 型 ， 泛 型 我 们 在 第 8 章 介绍 ， 这 里 表示 的 
是 ， 这 个 方法 可 以 支持 所 有 对 象 类 型 ， 只 要 传递 这 个 类 型 对 应 的 比较 
属 吏 可 以 了 。Comparator 束 是 比较 絮 ， 它 是 一 个 接口 ，Java 7 中 的 定义 


EI 
全 


public interface Comparator<T> { 
int compare(T o1, T 02); 
boolean equals(Object obj); 
} 


最 主要 的 是 compare 这 个 方法 ， 它 比较 两 个 对 象 ， 返 回 一 个 表示 比 
较 结果 的 值 ，-1 表 示 ol 小 于 02，0 表 示 o1 等 于 02， ss 排 
序 是 通过 比较 来 实现 的 ，sort 方 法 在 排序 的 过 程 中 需要 对 对 象 进行 比较 
的 时 候 ， 训 调用 比较 絮 的 compare 方 法 。Java 8 中 Comparator 增 加 了 多 
个 静态 和 默认 方法 ， 有 具体 可 参看 API 文 档 。 


String 类 有 一 个 public 静 态 成 员 ， 表 示 名 上 略 大 小 写 的 比较 妖 : 


public static final Comparator<String> CASE_INSENSITIVE_ORDER 
= new CaseInsensitiveComparator(); 


我 们 通过 这 个 比较 器 再 来 对 上 面 的 String 数 组 排序 : 


String[] arr = {"hello","world", "Break","abc"}; 
Arrays.sort(arr, String.CASE_ INSENSITIVE ORDER); 
System.out.println(Arrays.toString(arr)); 


这 样 ， 大 小 写 束 急 略 了， 输出 变 为 : 


[abc, Break, hello, world] 


为 进一步 理解 Comparator， 我 们 来 看 下 String 的 这 个 比较 器 的 主要 
实现 代码 ， 如 代码 清单 7-2 所 示 。 


代码 清单 7-2” String 的 CaseInsensitiveComparator 实 现 


private static class CaseInsensitiveComparator 
implements Comparator<String> { 
public int compare(String si, String s2) { 
int ni = si.length(); 
int n2 = s2.length(); 
int min = Math.min(n1i, n2); 
for(int i = 0; i < min; i++) { 
char c1 = si1.charAt(i); 
char c2 = s2.charAt(i),; 
if(c1i != c2) { 
c1 = Character.toUpperCase(c1),; 
c2 = Character.toUpperCase(c2); 
if(c1i != c2) { 
c1 = Character.toLowerCase(c1),; 
c2 = Character.toLowerCase(c2); 
if(c1i != c2) { 


//No overflow because of numeric promotion 
return c1 - c2; 
} 
} 
} 


return ni - n2; 


代码 比较 简单 直接 ， 开 不 解释 了 。 


sort 方 法 默认 是 从 小 到 大 排序 ， 如 果 硕 望 按 照 从 大 到 小 排序 呢 ? 对 
于 对 象 类 型 ， 可 以 指定 一 个 不 同 的 Comparator， 可 以 用 匿名 内 部 类 来 
实现 Comparator， 比 如 : 


String[] arr = {"hello","world", "Break","abc"}; 
Arrays.sort(arr, new Comparator<String>() { 
QOverride 
public int compare(String o1, String 02) { 
return o2.compareToIgnoreCase(o1); 
} 


}); 
System.out.println(Arrays.toString(arr)); 


程序 输出 为 : 


[world, hello, Break, abc] 


以 上 代码 使 用 一 个 匿名 内 部 类 实现 Comparator 接 口 ， 返 回 o2 与 ol 
J 略 大 小 写 比 较 的 结果 ， 这 样 吏 能 实现 忽略 大 小 写 且 按 从 大 到 小 
予 oO 


Collections 类 中 有 两 个 静态 方法 ， 可 以 返回 逆序 的 Comparator， 例 
如 : 


public static <T> Comparator<T> reverseOrder() 
public static <T> Comparator<T> reverseorder(Comparator<T> cmp) 


关于 Collections 类 ， 我 们 在 12.2 贡 介绍 。 


这 样 ， 上 面子 符 串 忽略 大 小 写 逆 序 排序 的 代码 可 以 改 为 : 


String[] arr = {"hello","world", "Break","abc"},; 
Arrays.sort(arr, Collections.reverseOrder(String.CASE INSENSITIVE ORDER)); 
System,.out.println(Arrays.toSstring(arr)); 


传递 比较 妖 Comparator 给 sort 方 法 ， 体 现 了 程序 设计 中 一 种 重要 的 
思维 方式 。 将 不 变 和 变化 相 分 离 ， 排 序 的 基本 步 又 和 算法 是 不 变 的 ， 
但 按 什么 排序 是 变化 的 ，sort 方 法 将 不 变 的 算法 设计 为 主体 逻辑 ， 而 将 
变化 的 排序 方式 设计 为 参数 ， 人 允许 调用 者 动态 指定 ， 这 也 是 一 种 常见 
的 设计 模式 ， 称 为 策略 模式 ， 不 同 的 排序 方式 就 是 不 同 的 策略 。 


3. 查 找 


Arrays 包 含 很 多 与 sort 对 应 的 查找 方法 ， 可 以 在 已 排序 的 数组 中 进 
行 二 分 查找 。 所 谓 二 分 查找 整 是 从 中 间 开 始 查 找 ， 如 有 果 小 于 中 间 元 
素 ， 则 在 前 半 部 分 查找 ， 人 否则 在 后 半 部 分 查找 ， 每 比较 一 次 ， 要 么 找 
到 ， 要 么 将 查找 范围 缩小 一 半 ， 所 以 碍 找 效 率 非 常 高 


二 分 查找 既 可 以 针对 基本 类 型 数组 ， 也 可 以 针对 对 象 数 组 ， 对 对 
也 可 以 传递 Comparator， 也 可 以 指定 查找 范围 。 比 如 ， 针 对 
int 交 组 : 


public static int binarySearch(int[] a, int key) 
public static int binarySearch(int[] a, int fromIndex, int toIndex, int key) 


针对 对 象 数组 : 
public static int binarySearch(Object[] a, Object key) 
指定 目 定义 比较 善 : 
public static <T> int binarySearch(T[] a, T key, Comparator<? Super T> c) 


如 果 能 找到 ，binarySearch 返 回 找到 的 元 素 索 引 ， 比 如 : 


int[] arr = {3,5,7,13,21}; 
System.out.println(Arrays.binarySearch(arr, 13)); 


输出 为 3。 如 果 没 找到 ， 返 回 一 个 负数 ， 这 个 负数 等 于 - (插入 点 
+1) 。 插 入 点 表示 ， 如 果 在 这 个 位 置 插入 没 找到 的 元 素 ， 可 以 保持 原 
数组 有 序 ， 比 如 : 


int[] arr = {3,5,7,13,21},; 
System.out.println(Arrays.binarySearch(arr, 11)); 


输出 为 -4， 表 示 插 入 点 为 3， 如 果 在 3 这 个 索引 位 置 处 插入 11， 可 
以 保持 数组 有 序 ， 即 数组 会 变 为 {3，5，7，11，13，21} 。 


需要 注意 的 是 ，binarySearch 针 对 的 必须 是 已 排序 数组 ， 如 果 指 定 
了 Comparator， 需 要 和 排序 时 指定 的 Comparator 保 持 一 致 。 另 外 ， 如 
果 数 组 中 有 多 个 匹配 的 元 素 ， 则 返回 哪 一 个 是 不 确定 的 。 
4. 蝎 多 方法 


除了 第 用 的 toString、 排 序 和 查找 ，Arrays 中 还 有 复制 、 比 较 、 批 
量 设置 值 和 计算 喻 希 值 等 方法 。 


基于 原 数组 ， 复 制 一 个 新 数组 ， 与 toString 一 样 ， 也 有 多 种 重 载 形 
式 ， 例 如 : 


public static long[] copyof(long[] original, int newLength ) 
public static <T> T[] copyof(T[] original, int newLength) 


判断 两 个 数组 是 否 相同 ， 文 持 基本 类 型 和 对 象 类 型 ， 如 下 所 示 : 


public static boolean equals(boolean[] a, boolean[] a2) 
public static boolean equals(Object[] a, Object[] a2) 


只 有 数组 长 度 相 同 ， 且 每 个 元 素 都 相同 ， 才 返回 tue， 否 则 返回 
false。 对 于 对 象 ， 相 同 是 指 equals 返 回 true 。 


， 可 以 给 数组 中 的 每 个 元 素 设置 一 个 相同 


public static void fill(int[] a, int val) 


也 可 以 给 数组 中 一 个 给 定 范 围 的 每 个 元 素 设置 一 个 相同 的 值 : 


public static void fill(int[] a, int fromIndex, int toIndex, int val) 


针对 数组 ， 计 算 一 个 数组 的 哈 布 值 : 


public static int hashcode(int a[]) 


计算 hashCode 的 算法 和 String 是 类 似 的 ， 我 们 看 下 代码 : 


public static int hashCode(int a[]) { 
if(a == null) 
return 0) 
int result = 1; 
for(int element : a) 
result = 31 * result + element,; 
return result 


} 


回顾 一 下 ，String 计 算 hashCode 的 算法 也 是 类 似 的 ， 数 组 中 的 每 个 
元 素 都 影响 hash 值 ， 位 置 不 同 ， 影 啊 也 不 同 ， 使 用 31 一 方面 产生 的 哈 
希 值 更 分 散 ， 男 一 方面 计算 效率 也 比较 高 。 


Java 8 和 9 对 Arrays 类 又 增加 了 一 些 方法 ， 比 如 将 数组 转换 为 流 、 
并 行 排序 、 数 组 比较 等 ， 具 体 可 参看 API 文 档 。 


7.4.2” 多维 数组 


之 前 介绍 的 数组 都 是 一 维 的 ， 数 组 还 可 以 是 多 维 的 。 移 来 看 二 维 
数组 ， 比 如 : 


int[][] arr = new int[2][3]; 
for(int i=0;i<arr.length;i++){ 
for(int j=0;j<arr[i].length;j++){ 
arr[i][j] = i+j; 


arr 职 是 一 个 二 维 数组 ， 第 一 维 长 度 为 2， 第 二 一 维 长 度 为 3， 类 似 于 
一 个 矩阵 ， 或 者 类 似 于 一 个 表格 ， 第 一 维 家 示 行 ， 和 第 二 维 表 示 列 。 
arr[ 计 表示 第 i 行 ， 它 本 身 还 是 一 个 数组 ，arr[i[j] 表 示 第 i 行 中 的 第 j 个 元 


O 
局 、 


除了 二 维 ， 数 组 还 可 以 是 三 维 、 四 维 等 ， 但 一 般 而 言 ， 很 少 用 到 
0 有 几 维 ， 隐 有 儿 个 0 。 比 如 ， 一 个 三 维 数 组 的 声明 


int[][][] arr = new int[10][10][10]; 


在 创建 数组 时 ， 除 了 第 一 维 的 长 度 需 要 指定 外 ， 其 他 维 的 长 度 不 
0 甚至 第 一 维 中 每 个 元 素 的 第 二 维 的 长 度 可 以 不 一 样 ， 看 个 


int[][] arr = new int[2][]; 
arr[0] = new int[3]; 
arr[1] = new int[5]; 


arr 是 一 个 二 维 数 组 ， 第 一 维 的 长 度 为 2， 第 一 个 元 素 的 第 二 维 长 
度 为 3， 而 第 二 个 元 素 的 第 二 维 长 度 为 5。 


多 多 维 数组 到 展 是 什么 呢 其 tf 实 ， 可 以 认为 ， 多 维 数 组 只 是 一 个 假 
象 ， 只 有 一 维 数 组 ， 只 是 数组 中 的 每 个 元 素 还 可 以 是 一 个 数组 ， 这 样 
中 形成 二 维 数组 ; 各 果 贡 中 每 个 元 还 都 是 一 个 数组 ， 那 就 古 三 维 数 
组 。 


Arrays 中 的 toString、equals、hashCode 都 有 对 应 的 针对 多 维 数 组 的 
万 局: 


public static String deepToString(Object[] a) 
public static boolean deepEquals(Object[] a1i, Object[] a2) 


public static int deepHashCode(Object af[]) 


这 些 deepXXX 方 法 ， 都 会 判断 参数 中 的 元 素 是 否 也 为 数组 ， 如 果 
是 ， 会 递归 进行 操作 。 


看 个 例子 : 


int[][] arr = new int[][]{{0,1},{2,3,4},1{5,6,7,8}}; 
System,.out.println(Arrays.deepToString(arr)); 


输出 为 : 


[Le, 1], [2, 3, 4], [5, 6, 7, 8]] 


7.4.3 ”实现 原理 


下 面 介 绍 Arrays 的 方法 的 实现 原理 。hashCode () 的 实现 我 们 已 
经 介绍 了 ; fl 和 equals 等 的 实现 都 很 简单 ， 循 环 操 作 即 可 ， 不 再 发 
述 ; 下 面 主 要 介绍 二 分 查找 和 排序 的 实现 代码 。 


二 分 查找 (binarySearch) 的 代码 比较 直接 ， 如 代码 清单 7-3 所 


代码 清单 7-3 ”Arrays 的 二 分 查找 实现 


private static <T> int binarySearcho(T[] a, int fromIndex, int toIndex, 
T key, Comparator<? super T> c) { 
int low = fromIndex; 
int high = toIndex - 1; 
while(low <= high) { 
int mid = (low + high) >>> 1; 
T midVal = a[mid]; 
int cmp = c.compare(midVal, key); 
if(cmp < 0) 
low = mid + 1; 
else if(cmp > 0) 
high = mid - 1; 
else 


return mid; //key found 


} 
return -(low + 1); //key not found 
} 


上 述 代 码 中 有 两 个 标志 : low 和 high， 表 示 查 找 范围 ， 在 while 循 环 
中 ， 与 中 间 值 进行 对 比 ， 大 于 则 在 后 半 部 分 查找 (提高 Iow) ， 否 则 在 
前 半 部 分 查找 (降低 high) 。 


2. 排 序 


与 Arrays 中 的 其 他 方法 相 比 ，sort 要 复杂 得 多 。 排 序 是 计算 机 程序 
中 一 个 非常 重要 的 方面 ， 几 十 年 来 ， 计 算 机 科学 家 和 工程 师 们 对 此 进 
行 了 大 量 的 研究 ， 设 计 实 现 了 各 种 各 样 的 算法 ， 进 行 了 大 量 的 优化 。 
一 般 而 言 ， 没 有 一 个 最 好 的 算法 ， 不 同 算法 往往 有 不 同 的 适用 场合 。 


那 Arrays 的 sort 是 如 何 实现 的 呢 ? 具体 实现 非常 复杂 ， 我 们 简单 了 


解 下 


对 于 基本 类 型 的 数组 ，Java 采 用 的 算法 是 双 枢 轴 快 速 排序 (Dual- 
Pivot Quicksort) 。 这 个 算法 是 Java 7 引入 的 ， 在 此 之 前 ，Java 采 用 的 
算法 是 普通 的 快速 排序 。 双 酌 轴 快速 排序 是 对 快速 排序 的 优化 ， 新 算 
法 的 实现 代码 位 于 类 java.util.DualPivotQuicksort 中 。 


对 于 对 象 类 型 ，Java 采 用 的 算法 是 TimSort。TimSort 也 是 在 Java 7 
引入 的 ， 在 此 之 前 ，Java 采 用 的 是 归并 排序 。TimSort 实 际 上 是 对 归并 
排序 的 一 系列 优化 ，TimSort 的 实现 代码 位 于 类 java.util.TimSort 中 。 


在 这 些 排 序 算法 中 ， 如 有 果 数 组 长 度 比 较 小 ， 它 们 还 会 采用 效率 更 
高 的 插入 排序 。 


为 什么 基本 类 型 和 对 象 类 型 的 算法 不 一 样 呢 ? 排序 算法 有 一 个 稳 
定性 的 概念 ， 所 谓 稳定 性 惑 是 对 值 相同 的 元 素 ， 如 采 排 序 前 和 排序 
人 那 算 法 区 是 稳定 的 ， 否 则 丈 
是 \ 稳 定 


快速 排序 更 快 ， 但 不 稳定 ， 而 归并 排序 是 稳定 的 。 对 于 基本 类 
型 ， 值 相同 就 是 完全 相同 ， 所 以 稳定 不 稳定 没有 关系 。 但 对 于 对 和 象 类 


人 一 


型 ， 相 同 只 是 比较 结果 一 样 ， 它 们 还 古 不 同 的 对 象 ， 其 他 实例 变量 也 
不 见得 一 样 ， 稳 定 不 稳定 可 能 号 很 有 关系 了 ， 所 以 采用 归并 排序 。 


这 些 算法 的 实现 是 比较 复杂 的 ， 所 六 的 是 ，Java 提 供 了 很 好 的 封 
锋 ， 绝 大 多 数 情况 下 ， 我 们 会 用 束 可 以 了 。 


TA 


其 实 ，Arrays 中 包含 的 数组 方法 是 比较 少 的 ， 很 多 常用 的 操作 没 
有 ， 比 如 ，Arrays 的 binarySearch 只 能 针对 已 排序 数组 进行 查找 ， 那 没 
有 排序 的 数组 怎么 方便 查找 呢 ? 


Apache 有 一 个 开源 包 (http://commons.apache.org/proper/commons- 
lang/ ) ， 里 面 有 一 个 类 ArrayUtils (位 于 包 
org. apache. commons.lang3) ， 包 含 了 更 多 的 常用 数组 操作 ， 这 里 就 不 
列举 了 。 


数组 是 计算 机 程序 中 的 基本 数据 结构 ，Arrays 类 以 及 ArrayUtils 类 
| 天 于 数组 的 常见 操作 ， 使 用 这 些 方法 ， 避 人 免 “重新 发 明 轮 
2 o 


7.5 剖析 日 期 和 时 间 


本 世 ， 我 们 讨论 Java 中 日 期 和 时 间 处 理 相 关 的 API。 日 期 和 时 间 是 
一 个 比较 复杂 的 概念 ，Java 8 之 前 的 设计 有 一 些 不 足 ， 业 界 有 一 个 广泛 
使 用 的 第 三 方 类 库 Joda-Time，Java 8 受 Joda-Time 影 响 ， 重 新 设计 了 日 
期 和 时 间 API， 新 增 了 一 个 包 java.time。 昌 然 Java 8 之 前 的 API 有 一 些 不 
足 ， 但 依然 是 被 大 量 使 用 的 ， 本 万 只 介绍 Java 8 之 前 的 API。 关 于 Java 
8 的 API， 它 使 用 了 Lambda 表 达 式 ， 我 们 还 没 介绍 ， 所 以 留 竺 到 第 26 章 


和。 


下 面 ， 我 们 先 来 看 一 些 基本 概念 ， 然 后 再 介绍 Java 的 日 期 和 时 间 
API。 


7.5.1 基本 概念 


关于 日 期 和 时 间 ， 有 一 些 基本 概念 ， 包 括 时 区 、 时 刻 、 纪 元 时 、 
年 历 等 。 


二 时 区 


我 们 都 知道 ， 同 一 时 刻 ， 世 界 上 各 个 地 区 的 时 间 可 能 是 不 一 样 
的 ， 具 体 时 间 与 时 区 有 关 。 全 球 一 共有 24 个 时 区 ， 现 国 格林 尼 治 是 0 时 
区 ， 北 京 是 东 八 区 ， 世 就 是 说 格林 尼 治 凌晨 1 点 ， 北 京 是 早上 9 点 。0 时 
区 的 时 间 也 称 为 GMT+0 时 间 ，GMT 是 格林 尼 治 标准 时 间 ， 北 京 的 时 间 
就 是 GMT+8: 00 。 


2. 时 刻 和 纪元 时 

所 有 计算 机 系统 内 部 都 用 一 个 整数 表示 时 刻 ， 这 个 整数 是 距离 格 
林 尼 治标 准时 间 1970 年 1 月 1 日 0 时 0 分 0 秒 的 训 秒 数 。 为 什么 要 用 这 个 时 
间 呢 ? 更 多 的 是 历史 原因 ， 本 书 就 不 介绍 了 。 


格林 尼 治 标准 时 间 1970 年 1 月 1 日 0 时 0 分 0 秒 也 个 称 为 Epoch Time 
(纪元 时 ) 


这 个 整数 表示 的 是 一 个 时 刻 ， 与 时 区 无 关 ， 世 界 上 各 个 地 方 都 是 
但 各 个 地 区 对 这 个 时 刻 的 解读 (如 年 月 日 时 分 秒 ， 可 能 
下 = $1 © 


对 于 1970 年 以 前 的 时 间 ， 使 用 负数 表示 。 
.FE 


我 们 都 知道 ， 中 国有 公历 和 农历 之 分 ， 公 历 和 农历 都 是 年 历 ， 不 
同 的 年 历 ， 一 年 有 多 少 月 ， 每 月 有 多 少 天 ， 甚 至 一 天 有 多 少 小 时 ， 这 
些 可 能 都 是 不 一 样 的 。 


比如 ， 公 历 有 头 年 ， 国 年 2 月 是 29 天 ， 而 其 他 年 份 则 是 28 天 ， 其 他 
月 份 ， 有 的 是 30 天 ， 有 的 是 31 天 。 农 历 有 国 月 ， 比 如 半 7 月 ， 一 年 就 会 
有 两 个 7 月 ， 一 共 13 个 月 


公历 是 世界 上 广泛 采用 的 年 历 ， 除 了 公历 ， 还 有 其 他 一 些 年 历 ， 
比如 日 本 也 有 自己 的 年 历 。Java API 的 设计 思想 是 支持 国际 化 的 ， 文 
持 多 种 年 历 ， 但 没有 直接 支持 中 国 的 农历 ， 本 书 主要 讨论 公历 。 


简单 总 结 下 ， 时 刻 是 一 个 绝对 时 间 ， 对 时 刻 的 解读 ， 则 是 相对 
的 ， 与 年 历 和 时 区 相关 。 


7.5.2 ”日 期 和 时 间 API 


Java API 中 关于 日 期 和 时 间 ， 有 三 个 主要 的 类 。 
.Date: 表示 时 刻 ， 即 绝对 时 间 ， 与 年 月 日 无 关 。 
Calendar: 表示 年 历 ，Calendar 是 一 个 抽象 类 ， 其 中 表示 公历 的 子 


类 是 Gregorian-Calendar 。 


-DateFormat: 表示 格式 化 ， 能 够 将 日 期 和 时 间 与 子 符 串 进 行 相互 
转换 ，DateFormat 也 是 一 个 抽象 类 ， 其 中 最 常用 的 子 类 是 


SimpleDateFormat ° 


还 有 两 个 相关 的 类 : 


.TimeZone: 表示 时 区 。 

.Locale: 表示 国家 (或 地 区 ) 和 语言 。 

下 面 ， 我 们 来 看 这 些 类 。 
1.Date 

Date 是 Java API 中 最 早 引 入 的 关于 日 期 的 类 ， 一 开始 ，Date 也 承载 
了 关于 年 历 的 角色 ， 但 由 于 不 能 文 持 国际 化 ， 其 中 的 很 多 方法 都 已 经 
过 时 了 ， 被 标记 为 了 @Deprecated， 不 再 建议 使 用 。 

Date 表 示 时 刻 ， 内 部 主要 是 一 个 long 类 型 的 值 ， 如 下 所 示 : 


private transient long fastTime 


fastTime 表 示 距 离 纪 元 时 的 训 秒 数 ， 此 处 ， 关 于 transient 关 键 字 ， 
我 们 暂时 忽略 。 


Date 有 两 个 构造 方法 : 


public Date(long date) { 
fastTime = date; 


} 
public Date() { 
this(System.currentTimeMillis()); 


第 一 个 构造 方法 是 根据 传 入 的 宫 秒 数 进行 初始 化 ， 第 二 个 构造 方 
法 是 默认 构造 方法 ， 它 根据 System.currentTimeMillis () 的 返回 值 进 行 
初始 化 。System.currentTimeMillis () 是 一 个 常用 的 方法 ， 它 返回 当前 
时 刻 距 离 纪元 时 的 量 秒 数 。 


Date 中 的 大 部 分 方法 都 已 经 过 时 了 ， 其 中 没有 过 时 的 主要 方法 有 
下 面 这 些 : 


public long getTime() // 返 回 毫秒 数 
public boolean equals(0bject obj) // 主 要 就 是 比较 内 部 的 毫秒 数 是 否 相同 
// 与 其 他 Date 进 行 比较 , 如 果 当 前 Date 的 毫秒 数 小 于 参数 中 的 返回 -1， 相 同 返 回 09， 否 则 返回 1 


public int compareTo(Date anotherDate) 

public boolean before(Date when) // 判 断 是 否 在 给 定 日 期 : 
public boolean after(Date when) // 判 断 是 否 在 给 定 日 期 之 
public int hashcode() // 哈 希 值 算法 与 Long 类 似 


一 | 


讯 六 


2.TimeZone 


TimeZone 表 示 时 区 ， 它 是 一 个 抽象 类 ， 有 静态 方法 用 于 获取 其 实 
例 。 获 取 当 前 的 默认 时 区 ， 代 码 为 ; 


TimeZone tz = TimeZone.getDefault(); 
System.out.println(tz.getID()); 


获取 默认 时 区 ， 并 输出 其 ID， 在 笔者 的 计算 机 中 ， 输 出 为 : 


Asia/Shanghai 


默认 时 区 是 在 哪里 设置 的 呢 ? 可 以 更 改 吗 ? Java 中 有 一 个 系统 属 
性 user.timezone， 你 存 的 就 是 默认 时 区 。 系 统 属性 可 以 通过 
System.getProperty 获 得 ， 如 下 所 示 : 


System.out.println(System.getProperty("user.timezone")); 
在 笔者 的 计算 机 中 ， 输 出 为 : 
Asia/Shanghai 


系统 属性 可 以 在 Java 局 动 的 时 候 传 入 参数 进行 更 改 ， 如 : 


java -Duser.timezone=Asia/Shanghai xxxx 


TimeZone 也 有 静 仿 方法 ， 可 以 获得 任意 给 定时 区 的 实例 。 比 如 ， 
获取 美国 东部 时 区 : 


TimeZone tz = TimeZone.getTimeZone("US/Eastern"),; 


ID 除 了 可 以 是 名 称 外 ， 还 可 以 是 GMT 形 式 表示 的 时 区 ， 如 : 
TimeZone tz = TimeZone.getTimeZone("GMT+08:00"); 


3.Locale 


Locale 表 示 国 家 (或 地 区 ) 和 语言 ， 它 有 两 个 主要 参数 : 一 个 是 
国家 (或 地 区 ) ; 另 一 个 是 语言 ， 每 个 参数 都 有 一 个 代码 ， 不 过 国家 
(或 地 区 ) 并 不 是 必需 的 。 比 如 ， 中 国内 地 的 代码 是 CN， 中 国 台湾 地 
美国 的 代码 是 US， 中 文 语言 的 代码 是 zd， 英文 语言 
J 代码 是 en。 


Locale 类 中 定义 了 一 些 静态 变量 ， 表 示 和 常见 的 Localeg， 比 如 : 
.Locale.US: 表示 美国 英语 。 

.Locale.ENGLISH: 表示 所 有 英语 。 

:Locale.TAIWAN: 表示 中 国 台 湾 地 区 所 用 的 中 文 。 
.Locale.CHINESE: 表示 所 有 中 文 。 
:Locale.SIMPLIFIED_CHINESE: 表示 中 国内 地 所 用 的 中 文 。 


与 TimeZone 类 似 ，Locale 也 有 静态 方法 获取 默认 值 ， 如 : 


Locale locale = Locale.getDefault(); 
System.out.println(locale.toString()); 


在 笔者 的 计算 机 中 ， 输 出 为 : 


zh_CN 


4.Calendar 


Calendar 类 是 日 期 和 时 间 操 作 中 的 主要 类 ， 它 表示 与 TimeZone 和 
Locale 相 天 的 日 历 信 息 ， 可 以 进行 各 种 相关 的 运算 。 我 们 移 来 看 下 它 
的 与 Date 类 似 ，Calendar 内 部 也 有 一 个 表示 时 刻 的 训 秒 数 ， 
定义 为 : 


protected long time; 


除 此 之 外 ，Calendar 内 部 还 有 一 个 数组 ， 表 示 日 历 中 各 个 字段 的 
值 ， 定 义 为: 


protected int fields[]; 


这 个 数组 的 长 度 为 17， 保 存 一 个 日 期 中 各 个 字段 的 值 ， 都 有 哪些 
字段 呢 ? Calendar 类 中 定义 了 一 些 静 态 变 量 ， 表 示 这 些 字 段 ， 主 要 


CalendarYEAR: 表示 年 。 


.Calendar.MONTH: 表示 月 ，1 月 是 0，Calendar 同 样 定义 了 表示 各 
个 月 份 的 静态 变量 ， 如 Calendar.JULY 表 示 7 月 。 


:Calendar.DAY _OF MONTH: 表示 日 ， 每 月 的 第 一 天 是 1。 


.Calendar.HOUR _OF DAY: 表示 小 时 ， 为 0~-23。 
CalendarMINUTE: 表示 分 钟 ， 为 0~59。 
CalendarSECOND: 表示 秒 ， 为 0~-59。 


CalendarMILLISECOND: 表示 毫秒 ， 为 0~-999。 


-CalendarDAY_OF_WEEK: 表示 星期 几 ， 周 日 是 1， 周 一 是 2， 局 
六 是 7，Calenar 同 样 定 义 了 表示 各 个 星期 的 静态 变量 ， 如 
Calendar.SUNDAY 表 示 周 日 。 


Calendar 是 抽象 类 ， 不 能 直接 创建 对 象 ， 它 提供 了 多 个 静态 方 
法 ， 可 以 获取 Calendar 实 例 ， 比 如 : 


public static Calendar getInstance'( ) 
public static Calendar getInstance(TimeZzone zone, Locale aLocale) 


最 终 调用 的 方法 都 是 需要 TimeZone 和 Locale 有 的 ， 如 果 没 有 ， 则 会 
使 用 上 面 介 绍 的 默认 值 。getInstance 方 法 会 根据 TimeZone 和 Locale 创 建 
对 应 的 Calendar 子 类 对 象 ， 在 中 文系 统 中 ， 子 类 一 般 是 表示 公历 的 


GregorianCalendar ° 


getInstance 方 法 封装 了 Calendar 对 象 创建 的 细节 。TimeZone 和 
Locale 不 同 ， 具 体 的 子 类 可 能 不 同 ， 但 都 是 Calendar。 这 种 隐藏 对 象 创 
建 细节 的 方式 ， 是 计算 机 程序 中 一 种 常见 的 设计 模式 ， 它 有 一 个 名 
字 ， 叫 工厂 方法 ，getInstance 就 是 一 个 工厂 方法 ， 它 生产 对 象 。 


与 new Date () 类 似 ， 新 创建 的 Calendar 对 象 表示 的 也 是 当前 时 
间 ， 与 Date 不 同 的 是 ，Calendar 对 和 象 可 以 方便 地 获取 年 月 日 等 日 历 信 
局 。 来 看 代码 ， 输 出 当前 时 间 的 各 种 信息 : 


Calendar calendar = Calendar ,getInstance() 

System.out,println("year: "+calendar.get(Calendar .YEAR) ) ， 
System,.out,println("month: "+calendar .get(Calendar ,MONTH ) ) ， 
System,.out,println("day: "+Ccalendar .get(Calendar ,DAY_OF_MONTH ) ) ; 
System,.out,println("hour: "+calendar .get(Calendar .HOUR_OF_DAY ) ) ; 
System,.out ,println("minute: "+Ccalendar ,get(Calendar .MINUTE) ) ， 
System,.out,println("Second: "+Ccalendar ,get(Calendar .SECOND ) ) ; 
System,out,.println("millisecond: "+calendar ,get(Calendar .MILLISECOND ) ) ， 
System.out.println("day_of week: " + calendar .get(Calendar .DAY_OF_WEEK) ) ， 


具体 输出 与 执行 时 的 时 间 和 默认 的 TimeZone 以 及 Locale 有 关 ， 比 
如 ， 在 笔者 的 计算 机 中 的 一 次 输出 为 : 


year: 2016 
month: 7 

day: 14 

hour: 13 

minute: 55 
second: 51 
millisecond: 564 
day_of_week: 2 


内 部 ，Calendar 会 将 表示 时 刻 的 毫秒 数 ， 按 照 TimeZone 和 Locale 对 
应 的 年 历 ， 计 算 各 个 日 历 字 段 的 值 ， 存 放 在 fields 数 组 中 ，Calendar.get 


方法 获取 的 就 是 fields 数 组 中 对 应 字段 的 值 。 
Calendar 文 持 根据 Date 或 台 秒 数 设置 时 间 : 


public final void setTime(Date date) 
public void setTimeINMillis(long millis) 


也 文 持 根据 年 月 日 等 日 历 字 段 设置 时 间 ， 比 如 : 


public final void set(int year, int month, int date ) 
public final void set(int year, int month, int date, 
int hourofDay, int minute, int second) 

public void set(int field, int value) 


除了 直接 设置 ，Calendar 文 持 根据 字段 增加 和 减少 时 间 : 


public void add(int field, int amount ) 


amount 为 正 数 表 示 增 加 ， 负 数 表 示 减 少 。 
比如 ， 如 有 果 想 设置 Calendar 为 第 二 天 的 下 午 2 点 15， 代 码 可 以 为 : 


Calendar calendar = Calendar.getIinstance(); 
calendar .add(Calendar .DAY_OF_MONTH, 1); 
calendar.set(Calendar .HOUR_OF_DAY, 14); 
calendar.set(Calendar .MINUTE, 15); 

Calendar .set(Calendar .SECOND, 0); 

calendar .set(Calendar .MILLISECOND, 0); 


Calendar 的 这 些 方法 中 一 个 比较 方便 和 强大 的 地 方 在 于 ， 它 能 够 
目 动 调整 相关 的 字段 。 比 如 ， 我 们 知道 2 月 最 多 有 29 天 ， 如 果 当 前 时 间 
为 1 月 30 号 ， 对 Calendar.MONTH 字 上 7 段 加 1， 即 增加 一 月 ，Calendar 不 是 
简单 的 只 对 月 字段 加 1， 那 样 日 期 是 2 月 30 号 ， 是 无 效 的 ，Calendar 会 
目 动 调整 为 2 月 最 后 一 天 ， 即 2 月 28 日 或 29 日 。 


再 如 ， 设 置 的 值 可 以 超出 其 字段 最 大 范围 ，Calendar 会 目 动 更 新 
其 他 字段 ， 如 : 


Calendar calendar = Calendar ,getInstance() 
calendar .add(Calendar .HOUR_OF_DAY, 48); 
calendar .add(Calendar .MINUTE, -120); 


相当 于 增加 了 46 小 时 。 


内 部 ， 根 据 字 上 段 设 置 或 修改 时 间 时 ，Calendar 会 更 新 fields 数 组 对 

应 字段 的 值 ， 但 一 般 不 会 立即 更 新 其 他 相关 字段 或 内 部 的 训 秒 数 的 

全， 过 在 获取 时 间或 字段 值 的 时 候 ，Calendar 会 重新 计算 并 更 新 相 
字段 。 


简单 总 结 下 ，Calenar 做 了 一 项 非常 烦琐 的 工作 ， 根 据 TimeZone 和 
Locale， 在 绝对 时 间 龟 秒 数 和 日 历 字 段 之 间 目 动 进行 转换 ， 且 对 不 同 
日 历 字 段 的 修改 进行 目 动 同步 更 新 。 


除了 add 方 法 ，Calendar 还 有 一 个 类 似 的 方法 : 


public void roll(int field, int amount ) 


: 与 add 方 法 的 区 别 是 ，rol 方 法 不 影响 时 间 范 围 更 大 的 字段 值 。 比 
站: 


Calendar calendar = Calendar ,getInstance() 
calendar.set(Calendar .HOUR_OF_DAY, 13); 
calendar.set(Calendar .MINUTE, 59); 

calendar .add(Calendar .MINUTE, 3); 


calendar 首 先 设置 为 13: 59， 然 后 分 钟 字 段 加 3， 执 行 后 的 calendar 
时 间 为 14: 02。 如 果 add 改 为 roll， 即 : 


Calendar .roll(Calendar .MINUTE, 3); 


则 执行 后 的 calendar 时 间 会 变 为 13: 02， 在 分 钟 字段 上 执行 roll 方 
法 不 会 改变 小 时 的 值 。 


Calendar 可 以 方便 地 转换 为 Date 或 毫秒 数 ， 方 法 是 : 


public final Date getTime() 
public long getTimeINMillis() 


与 Date 类 似 ，Calendar 之 间 也 可 以 进行 比较 ， 也 实现 了 Comparable 
接口 ， 相 天方 法 有 : 


public boolean equals(Object obj ) 
public int compareTo(Calendar anotherCcalendar ) 
public boolean after(Object when) 
public boolean before(Object when) 


5.DateFormat 


DateFormat 类 主要 在 Date 和 字符 串 表示 之 间 进 行 相互 转换 ， 它 有 
两 个 主要 的 方法 : 


public final String format(Date date) 
public Date parse(String source) 


format 将 Date 转 换 为 字符 串 ，parse 将 字符 串 转 换 为 Date。 


Date 的 字符 串 表示 与 TimeZone 和 Locale 都 是 相关 的 ， 除 此 之 外 ， 
还 与 两 个 格式 化 风格 有 关 ， 一 个 是 日 期 的 格式 化 风格 ， 另 一 个 是 时 间 
的 格式 化 风格 。DateFormat 定 义 了 4 个 静态 变量 ， 表 示 4 种 风格 : 
SHORT、MEDIUM、LONG 和 FULL; 还 定义 了 一 个 静态 变量 
DEFAULT， 表 示 默 认 风 格 ， 值 为 MEDIUM， 不 同 风格 输出 的 信息 详 
细 程 度 不 同 。 


与 Calendar 类 似 ，DateFormat 也 是 抽象 类 ， 也 用 工厂 方法 创建 对 
象 ， 提 供 了 多 个 静态 方法 创建 DateFormat 对 象 ， 有 三 类 方法 : 


public final static DateFormat getDateTimeInstance() 
public final static DateFormat getDateInstance() 
public final static DateFormat getTimeInstance() 


getDateTimeInstance 方 法 既 处 理 日 期 也 处 理 时间 ，getDateInstance 
方法 只 处 理 日 期 ，get-TimeInstance 方 法 只 处 理 时 间 。 看 下 面 的 代码 : 


Calendar calendar = Calendar ,getInstance() 

//2016-08-15 14:15:20 

calendar.set(2016, 07, 15, 14, 15, 20); 

System.out,println(DateFormat .getDateTimeInstance() 
,format(calendar ,getTime()))， 

System.out,println(DateFormat .getDateInstance'( ) 
,format(calendar ,getTime()))， 

System.out,println(DateFormat .getTimeInstance'( ) 
,format(calendar ,getTime()))， 


输出 为 : 


2016-8-15 14:15:20 
2016-8-15 
14:15:20 


每 类 工厂 方法 都 有 两 个 重 载 的 方法 ， 接 受 日 期 和 时 间 风 格 以 及 
Locale 作 为 参 关 


DateFormat getDateTimeInstance(int dateStyle, int timeStyle) 
DateFormat getDateTimeInstance(int dateStyle, int timeStyle, Locale aLocale) 


比如 ， 看 下 面 的 代码 : 


Calendar calendar = Calendar.getIinstance(); 

//2016-08-15 14:15:20 

calendar.set(2016, 07, 15, 14, 15, 20); 

System.out.println(DateFormat.getDateTimeInstance(DateFormat.LONG, 
DateFormat ,SHORT,Locale.CHINESE) .format(calendar .getTime())); 


输出 为 : 


-一 
地 


2016 年 8 月 15 F2:15 


DateFormat 的 工厂 方法 里 ， 我 们 没 看 到 TimeZone 参 数 ， 不 过 ， 
DateFormat 提 供 了 一 个 setter 方 法 ， 可 以 设置 TimeZone: 


public void setTimeZone(TimeZone zone) 


DateFormat 虽 然 比 较 方 便 ， 但 如 果 我 们 要 对 字符 串 格 式 有 更 精确 
的 控制 ， 则 应 该 使 用 SimpleDateFormat 这 个 类 。 


6.SimpleDateFormat 


SimpleDateFormat 是 DateFormat 的 子 类 ， 相 比 DateFormat， 它 的 一 
个 主要 不 同 是 ， 它 可 以 接受 一 个 自 定 义 的 模式 (pattern) 作为 参数 ， 
这 个 模式 规定 了 Date 的 字符 串 形式 。 先 看 个 例子 : 


Calendar calendar = Calendar.getInstance(); 

//2016-08-15 14:15:20 

Calendar .set(2016, 07, 15, 14, 15, 20); 

SimpleDateFormat sdf = new SimpleDateFormat:( 
"yyyy 年 MM 月 dd 日 E HH 时 mm 分 ss 秒 "); 

System.out. println(sdf. format(calendar.getTime())); 


输出 为 : 


2016 年 08 月 15 日 星期 一 14 时 15 分 20 秒 


SimpleDateFormat 有 个 构造 方法 ， 可 以 接受 一 个 pattern 作 为 参数 ， 
这 里 pattern 是 : 


yyyy 年 MM 月 dd 日 E HH 时 mm 分 ss 秒 


pattern 中 的 英文 字符 az 和 A 一 2Z 表 示 特 殊 合 义 ， 其 他 字符 原样 输 
加 这 各 


-yyyy: 表示 4 位 的 年 。 

"MM: 表示 月 ， 用 两 位 数 表示 。 

dd: 表示 日 ， 用 两 位 数 表示 。 

HH: 表示 24 小 时 制 的 小 时 数 ， 用 两 位 数 表示 。 
-mm: 表示 分 钟 ， 用 两 位 数 表示 。 


ss: 表示 秒 ， 用 两 位 数 表 示 。 
下 :表示 星期 几 。 


特意 提醒 一 下 ，hh 也 表示 小 时 数 ， 但 表示 的 是 12 小 时 制 
的 小 周 数 ， 而 a 表示 的 是 上 年 还 不 是 下 午 ， 看 代码 : 


Calendar calendar = Calendar.getIinstance(); 

//2016-08-15 14:15:20 

calendar.set(2016, 07, 15, 14, 15, 20); 

SimpleDateFormat sdf = new SimpleDateFormat("yyyy/MM/dd hh:mm:ss a"); 
System.out.println(sdf.format(calendar .getTime())); 


输出 为 : 


2016/08/15 02:15:20 下 午 


更 多 的 特殊 含义 可 以 参看 SimpleDateFormat 的 API 文 档 。 如 果 想 原 
样 输出 英文 字符 ， 可 以 将 其 用 单 引 号 括 起 来 。 


除了 将 Date 转 换 为 字符 串 ，SimpleDateFormat 也 可 以 方便 地 将 字符 
串 转 化 为 Date， 看 代码 : 


String str = "2016-08-15 14:15:20.456"; 
SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss.SSS"); 
try { 
Date date = sdf.parse(str),; 
SimpleDateFormat sdf2 = new SimpleDateFormat("yyyy 年 M 月 d h:m:s.SsS a"); 
System.out.println(sdf2.format(date)); 
} catch (ParseException e) { 
e.printStackTrace( ); 


输出 为 : 


2016 年 8 月 15 2:15:20.456 下 午 


代码 将 字符 串 解析 为 了 一 个 Date 对 象 ， 然后 使 用 男 外 一 个 格式 进 
行 了 输出 ， 这 里 SSS 表 示 三 位 的 襄 秒 数 。 庆 要 让 入 的 是 parse 会 抛 出 


一 个 受 检 异 常 ， 异 常 类 型 为 ParseException， 调 用 者 必须 进行 处 理 。 


7.5.3 ”局 限 性 


至 此 ， 天 于 Java 8 之 前 的 日 斯 和 时 间 相 关 API 的 主要 内 容 基本 就 介 
绍 完了 。Date 表 示 时 刻 ， 与 年 月 日 无 关 ，Calendar 表 示 日 历 ， 与 时 区 和 
Locale 相 关 ， 可 进行 各 种 运算 ， 是 日 期 时 间 控 作 的 主要 类 ， 
DateFormat/SimpleDateFormat 在 Date 和 字符 串 之 间 进 行 相 互 转换 。 这 
些 API 存 在 着 一 些 局 限 性 ， 下 面 强调 一 下 。 


1.Date 中 的 过 时 方法 


Date 中 的 方法 参数 与 解 识 不 符合 ， 过 时 方法 标记 容易 被 人 忽略 ， 
产生 误 用 。 比 如 ， 看 如 下 代码 : 


Date date = new Date(2016,8,15); 
System.out,println(DateFormat .getDateInstance().format(date) )， 


想当然 的 输出 为 2016-08-15， 但 其 实 输出 为 : 


3916-9-15 


之 所 以 产生 这 个 输出 ， 是 因为 Date 构 造 方法 中 的 year 表 示 的 是 与 
1900 年 的 差 ，month 是 从 0 开始 的 。 
2.Calendar 操 作 比 较 烦 瑞 


Calendar API 的 设计 不 是 很 成 功 ， 一 些 简单 的 操作 都 需要 多 次 方法 
调用 ， 写 很 多 代码 ， 比 较 爱 肿 。 


另外 ，Calendar 难 以 进行 比较 复杂 的 日 期 操作 ， 比 如 ， 计 算 两 个 
日 期 之 间 有 多 少 个 月 ， 根 据 生日 计算 年 龄 ， 计 算 下 个 月 的 第 一 个 周一 


3.DateFormat 的 线程 安全 性 


DateFormat/SimpleDateFormat 不 是 线程 安全 的 。 关 于 线程 概念 ， 
第 15 章 会 详细 介绍 ， 这 里 简单 说 明 一 下 。 多 个 线程 同时 使 用 一 个 
DateFormat 实 例 的 时 候 ， 会 有 问题 ， 因 为 DateFormat 内 部 使 用 了 一 个 
Calendar 实 例 对 象 ， 多 线程 同时 调用 的 时 候 ， 这 个 Calendar 实 例 的 状态 
可 能 驶 会 紊乱 。 

解决 这 个 问题 大 概 有 以 下 方案 : 

:每 次 使 用 DateFormat 都 新 建 一 个 对 象 。 

使 用 线程 同步 〈 第 15 章 介绍 ) 

.使 用 ThreadLocal (第 19 章 介绍 ) 


.使 用 Joda-Time 或 Java 8 的 API， 它 们 是 线程 安全 的 。 


7.6 ”随机 


人 
求 ， 比如 : 


:各 种 游戏 中 有 大 量 的 随机 ， 比 如 扑克 游戏 中 的 尝 脾 。 

- 微 信 抢 红包 ， 抢 的 红包 金额 是 随机 的 。 

北京 购车 摇号 ， 谁 能 播 到 是 随机 的 。 

“给 用 户 生 成 随机 密码 。 

我 们 首先 来 介绍 Java 对 随机 的 文 持 ， 同 时 介绍 其 实现 原理 ， 然 后 


针对 一 些 实 际 场景 ， 包 括 洗 牌 、 抢 红包 、 揪 号、 随机 高 强度 密码 、 市 
人 


7.6.1 Math.random 


Java 中 ， 对 随机 好 基 本 的 文 持 是 Math 类 中 的 静态 方法 random 
() ， 它 生成 一 个 0 一 1 的 随机 数 ， 类 型 为 double， 包 括 0 但 不 包括 1。 
比如 ， 随 机 生成 并 输出 3 个 数 : 


for(int i=0;i<3;i++) 
System.out.println(Math.random()); 
} 


笔者 的 计算 机 中 的 一 次 运行 ， 输 出 为 : 


0.4784896133823269 
0.03012515628333423 
0.7921024363953197 


每 次 运行 ， 输 出 都 不 一 样 。Math.random () 是 如 何 实 现 的 呢 ? 我 
们 来 看 相关 代码 (Java 7) 


private static Random randomNumberGenerator; 
private static synchronized Random initRNG() { 
Random rnd = randomNumberGenerator,; 
return (rnd == null) ? (randomNumberGenerator = new Random()) : rnd; 


} 

public static double random() { 
Random rnd = randomNumberGenerator,; 
If (rnd == null) rnd = initRNG(); 
return rnd.nextDouble(); 


} 


内 部 它 使 用 了 一 个 Random 类 型 的 静态 变 
randomNumberGenerator， 调 用 random () 就 是 调用 该 变量 的 
nextDouble () 方法 ， 这 个 Random 变 量 只 有 在 第 一 次 使 用 的 时 候 才 创 
建 o 


al 


下 面 我 们 来 看 这 个 Random 类 ， 它 位 于 包 java.util 下 。 
7.6.2 Random 


Random 类 提供 了 更 为 丰富 的 随机 方法 ， 它 的 方法 不 是 静态 方法 ， 
使 用 Random， 先 要 创建 一 个 Random 实 例 ， 看 个 例子 : 


Random rnd = new Random( ); 
System.out.println(rnd.nextInt()); 
System.out.println(rnd.nextInt(100)); 


笔者 计算 机 中 的 一 次 运行 ， 输 出 为 : 


-1516612608 
23 


nextInt () 产生 一 个 随机 的 int， 可 能 为 正 数 ， 也 可 能 为 负数 ， 
nextInt (100) 产生 一 个 随机 int， 范 围 是 0 一 100， 包 括 0 不 包括 100。 除 
了 nextInt， 还 有 一 些 别 的 方法 : 


public long nextLong() // 随 机 生成 一 个 long 

public boolean nextBoolean() // 随 机 生成 一 个 boolean 
public void nextBytes(byte[] bytes) // 产 生 随 机 字 节 ， 字 节 个 数 就 是 bytes 的 长 度 
public float nextFloat() // 随 机 浮 点 数 ， 从 0 到 1， 包 括 0 不 包括 1 

public double nextDouble() // 随 机 浮 点 数 ， 从 9 到 1， 包 括 60 不 包括 1 


除了 默认 构造 方法 ，Random 类 还 有 一 个 构造 方法 ， 可 以 接受 一 个 


long 类 型 的 种 子 参数 : 


public Random(Jong seed) 


种 子 决定 了 随机 产生 的 序列 ， 种 子 相 同 ， 产 生 的 随机 数 序列 束 是 


相同 的 。 看 个 例子 : 


Random rnd = new Random(20160824); 

for(int i=0;i<5;i++){ 
System.out.print(rnd.nextInt(100)+" "); 

} 


种 子 为 20160824， 产 生 5 个 0~100 的 随机 数 ， 输 出 为 : 


69 13 13 94 50 


这 个 程序 无 论 执行 多 少 笛 ， 在 哪 执 行 ， 输 出 结果 都 是 相同 的 。 
除了 在 构造 方法 中 指定 种 子 ，Random 类 还 有 一 个 setter 实 例 方 


法 : 


synchronized public void setSeed(long seed) 


其 效 采 与 在 构造 方法 中 指定 种 和子 是 一 样 的 。 
为 什么 要 指定 种 子 呢 ? 指定 种 子 还 是 真正 的 随机 吗 ? 指定 种 子 是 


为 了 实现 可 重复 的 随机 。 比如 用 于 模拟 测试 程序 中 ， 模 拟 要 求 随机 ， 
但 测试 要 求 可 重复 。 在 北京 购车 播 号 程序 中 ， 种 子 也 十 指定 的 ， 后 面 
我 们 还 会 介绍 。 种 子 到 弃 扮 小 了 什么 角色 呢 ? 随机 到 瓜 是 如 何 产生 的 
呢 ? 让 我 们 看 下 随机 的 基本 原理 。 


7.6.3 ”随机 的 基本 原理 


Random 产 生 的 随机 数 不 是 真正 的 随机 数 ， 相 反 ， 生 产生 的 随机 数 
一 般 称 为 仿 随 机 数 。 真正 的 随机 数 比较 难以 产生 ， 计 算 机 程序 中 的 随 
机 数 一 般 都 是 伪 随 机 数 。 


伪 随 机 数 都 古 基 于 一 个 种 子 数 的 ， 然 后 每 需要 一 个 随机 数 ， 都 是 
对 当前 种 子 进行 一 些 数学 运算 ， 得 到 一 个 数 ， 基 于 这 个 数 得 到 需要 的 
随机 数 和 新 的 种 子 。 


数学 运算 是 固定 的 ， 所 以 种 子 确定 后 ， 产 生 的 随机 数 序列 殉 是 确 
定 的， 确定 的 数字 序列 当然 不 是 真正 的 随机 数 ， 但 种 子 不 同 ， 序 列 束 
子 列 中 数字 的 分 布 也 都 是 比较 随机 和 均匀 的 ， 所 以 称 之 为 
女 9 


Random 的 默认 构造 方法 中 没有 传递 种 子 ， 它 会 目 动 生成 一 个 种 
子 ， 这 个 种 子 数 是 一 个 真正 的 随机 数 ， 如 下 所 示 (Java 7) : 


private static final AtomicLong seedUniquifier 
= New AtomicLong(8682522807148012L ); 

public Random() { 
this(seedUniquifier() 人 ^ System.nanoTime()); 


private static long seedUniquifier() { 
;77) { 
long current = seedUniquifier.get(); 
long next = current * 181783497276652981L; 


if(seedUniquifier.compareAndSet(current, next)) 
return next,; 


种 子 是 seedUniquifier () 与 System.nanoTime () 按 位 异 或 的 结 
果 ，System.nanoTime () 返回 一 个 更 高 精度 ( 纳 秒 ) 的 当前 时 间 ， 
seedUniquifier () 里 面 的 代码 涉及 一 些 多 线程 相关 的 知识 ， 我 们 后 续 
章 世 再 介绍 ， 简 单 地 说 ， 就 是 返回 当前 seedUniquifier (current 变 量 ) 
与 一 个 常数 181783497276652981L 相 乘 的 结果 (next 变 量 ) ， 然 后 ， 设 
置 seedUniquifier 的 值 为 next， 使 用 循环 和 compareAndSet 都 是 为 了 确保 
在 多 线程 的 环境 下 不 会 有 两 次 调用 返回 相同 的 值 ， 保 证 随机 性 。 


有 了 种 子 数 之 后 ， 其 他 数 是 怎么 生成 的 呢 ? 我 们 来 看 一 些 代 码 : 


public int nextInt() { 
return next(32) 


} 
public long nextLong() { 
return ((long)(next(32)) << 32) + next(32); 


} 
public float nextFloat() { 
return next(24) / ((float)(1 << 24)); 


public boolean nextBoolean() { 
return next(1) != 0; 
} 


它们 都 调用 了 next (int bits) ， 生 成 指定 位 数 的 随机 数 ， 我 们 来 看 
下 它 的 代码 : 


private static final long multiplier = Ox5DEECE66DL; 
private static final long addend = QOxBL; 
private static final long mask = (1L << 48) - 1; 
protected int next(int bits) { 
long oldseed, nextseed,; 
AtomicLong seed = this.seed; 
do { 
oldseed = seed.get(); 
nextseed = (oldseed * multiplier + addend) & mask; 
} while (!seed.compareAndSet(oldseed, nextseed)); 
return (int)(nextseed >>> (48 - bits)); 


人 简单 地 说 ， 殊 是 使 用 了 如 下 公式 : 
nextseed = (oldseed * multiplier + addend) & mask; 


旧 的 种 子 (oldseed) 乘 以 一 个 数 (multiplier) ， 加 上 一 个 数 
addend， 然 后 取 低 48 位 作为 结果 (mask 相 与 ) 。 


为 什么 采用 这 个 方法 ? 这 个 方法 为 什么 可 以 产生 随机 数 ? 这 个 方 
法 的 名 称 叫 线性 同 余 随机 数 生成 器 (linear congruential pseudorandom 
number generator) ， 描 述 在 《计算 机 程序 设计 艺术 》 一 书 中 。 随 机 的 
理论 是 一 个 比较 复杂 的 话题 ， 超 出 了 本 书 的 范畴 ， 我 们 就 不 讨论 了 。 


我 们 需要 知道 的 基本 原理 是 : 随机 数 基于 一 个 种 和子， 种 子 固定 ， 
随机 数 序列 束 国 是， 默认 构造 方法 中 ， 种 子 是 一 个 真正 的 随机 数 。 


理解 了 随机 的 基本 概念 和 原理 ， 我 们 来 看 一 些 应 用 场景 ， 包 括 随 
内 密码 、 洗 牌 、 带 权重 的 随机 选择 、 微 信 抢 红包 算法 ， 以 及 北京 了 车 
叶 号 算法 。 


7.6.4 ”随机 密码 


在 给 用 户 生成 账号 时 ， 经 前 需 要 给 用 户 生成 一 个 黑 认 随机 密码 ， 
然后 通过 邮件 或 短信 发 给 用 户 ， 作 为 初次 登录 使 用 。 我 们 假定 密码 是 6 
位 数字 ， 代 码 很 简单 ， 如 代码 清单 7-4 所 示 。 


代码 清单 7-4 生成 随机 密码 : 6 位 数字 


public static String randomPassword(){ 
char[] chars = new char[6]; 
Random rnd = new Random( ) ; 
for(int i=0; i<6; i++){ 
chars[i] = (char)('0'+rnd.nextInt(10))， 


return new String(chars ) ， 


代码 很 简单 ， 就 不 解释 了 。 如 果 要 求 是 8 位 密码 ， 字 符 可 能 由 大 写 
字母 、 小 写字 母 、 数 字 和 特殊 符号 组 成 ， 如 代码 清单 7-5 所 示 。 


代码 请 单 7-5 ”生成 随机 密码 :简单 8 位 


private static final String SPECIAL_CHARS = "1@#$%A&*_ =+-/"; 
private static char nextChar(Random rnd){ 
switch(rnd.nextInt(4)){ 
case 0: 
return (char)('a'+rnd.nextInt(26)); 
case 1: 
return (char)('A'+rnd.nextInt(26)); 
case 2: 
return (char)('O'+rnd.nextInt(10)); 
default: 
return SPECIAL_CHARS.charAt(rnd.nextInt(SPECIAL_CHARS.1length())); 
} 


public static String randomPassword(){ 
char[] chars = new char[8]; 
Random rnd = new Random( ) ; 
for(int i=0; i<8; i++){ 
chars[i] = nextChar(rnd ) ， 


return new String(chars ) ， 


这 段 代 码 ， 对 每 个 字符 ， 移 随机 选 类 型 ， 然 后 在 给 定 类 型 中 随机 
选 字 符 。 在 笔者 的 计算 机 中 ， 一 次 的 随机 运行 结果 十 : 


8Ctp2S4H 


这 个 结 采 不 含 特殊 字符 。 很 多 环境 对 密码 复杂 度 有 要 求 ， 比 如 ， 
军 少 要 全 二 大 司 守 和 人 仆 本 芋 二 小 伞 珠 付 号 二 小 到 年 
以 上 的 代码 满足 不 了 这 个 要 求 ， 怎 么 满足 呢 ? 一 种 可 能 的 代码 如 代码 
清单 7-6 所 示 。 


代码 清单 7-6 ”生成 随机 密码 复杂 8 位 


private static int nextIndex(char[] chars, Random rnd){ 
int index = rnd.nextIint(chars.1length); 
while(chars[index]!=0){ 
index = rnd.nextIint(chars.1length); 


return index; 
} 
private static char nextSpecialChar(Random rnd){ 
return SPECIAL_CHARS.charAt(rnd.nextInt(SPECIAL_CHARS.1length())); 
} 


private static char nextUpperlLetter(Random rnd ){ 
return (char)('A'+rnd.nextInt(26)); 
} 


private static char nextLowerLetter(Random rnd){ 
return (char)('a'+rnd.nextInt(26)); 
} 


private static char nextNumLetter(Random rnd){ 
return (char)('0'+rnd.nextInt(10)); 


public static String randomPassword(){ 
char[] chars = new char[8]; 
Random rnd = new Random( ); 
chars[nextIndex(chars, rnd)] 
chars[nextIndex(chars, rnd)] 
chars[nextIndex(chars, rnd)] 
chars[nextIndex(chars, rnd)] 
for(int i=0; i<8; i++){ 

if(chars[i]==0){ 
chars[i] = nextChar(rnd ) ， 


nextSpecialChar(rnd ) ， 
nextUpperlLetter(rnd); 
nextLowerLetter(rnd); 
nextNumLetter(rnd); 


} 


return new String(chars ) ， 


nextIndex 随 机 生成 一 个 未 赋值 的 位 置 ， 程 序 先 随机 生成 4 个 不 同类 
型 的 字符 ， 放 到 随机 位 置 上 ， 然 后 给 未 赋值 的 其 他 位 置 随机 生成 字 
符 。 


7.6.5” 洗 有 牌 


一 种 彰 见 的 随机 场景 是 洗 牌 ， 束 是 将 一 个 数组 或 序列 随机 重新 排 
列 。 我 们 以 一 个 整数 数组 为 例 来 介绍 如 何 随机 重 排 ， 如 代码 清单 7-7 所 
泵 。 


代码 清单 7-7 随机 重 排 


private static void swap(int[] arr, int i, int j){ 
int tmp = arr[i]; 
arr[i] = arr[j]; 
arr[j] = tmp; 
} 
public static void shuffle(int[] arr){ 
Random rnd = new Random(); 
for(int i=arr.length; i>1; i--) { 
swap(arr, i-1, rnd.nextInt(i)); 


shuffle 方 法 能 将 参数 数组 arr 随 机 重 排 ， 来 看 使 用 它 的 代码 : 


int[] arr = new int[13]; 
for(int i=0; i<arr.length; i++){ 
arr[i] = i; 


shuffle(arr); 
System.out.println(Arrays.toSstring(arr)); 


调用 shuffle 方 法 前 ，arr 是 排 好 序 的 ， 调 用 后 ， 一 次 调用 的 输出 


[3, 8, 11, 10, 7, 9, 4, 1, 6, 12, 5, 0, 2] 


已 经 随机 重新 排序 了 。shuffle 的 基本 思路 是 什么 呢 ? 从 后 往 前 ， 
逐个 给 每 个 数组 位 置 重 新 赋值 ， 值 是 从 剩 下 的 元 素 中 随机 挑选 的 。 在 


如 下 关键 语句 中 : 


swap(arr, i-1, rnd.nextInt(1)); 


i-1 表 示 当 前 要 赋值 的 位 置 ，rnd.nextInt (i) 表示 从 剩 下 的 元 素 中 
随机 挑选 。 


7.6.6 ”市 权重 的 随机 选择 


实际 场景 中 ， 经 前 要 从 多 个 选项 中 随机 选择 一 个 ， 不 过 ， 不 同 选 
项 经 单 有 不 同 的 权重 。 比 如 ， 给 用 户 随 机 奖励 ， 三 种 面额 : 1 元 、5 元 
和 10 元 ， 权 重 分 别 为 70、20 和 10。 这 个 怎么 实现 呢 ? 实现 的 基本 思路 
征 ， 使 用 概率 中 的 素 计 概率 分 布 。 


以 上 面 的 例子 来 说 ， 计 算 每 个 选项 的 累计 概率 值 ， 首 先 计 算 总 的 
权重 ， 这 里 正好 是 100， 每 个 选项 的 概率 是 70%、20% 和 10%， 标 计 概 
率 则 分 别 是 70%、90% 和 100%。 


1 元 5 10 元 


0.7 0.9 1.0 


图 7-2 ”选项 的 素 计 概率 值 


有 了 累计 概率 ， 则 随机 选择 的 过 程 是 : 使 用 nextDouble () 生成 
一 个 0~1 的 随机 数 ， 然 后 使 用 二 分 查找 ， 看 其 落 入 哪个 区 间 ， 如 果 人 小 
于 等 于 70% 则 选择 第 一 个 选项 ，70% 和 909% 之 间 选 第 二 个 ，90% 以 上 选 
第 三 个 ， 如 图 7-2 所 示 。 


下 面 来 看 代码 ， 我 们 使 用 一 个 类 Pair 表 示 选 项 和 权重 ， 如 代码 清 
单 7-8 所 示 。 


代码 清单 7-8 ”表示 选项 和 权重 的 类 Pair 


Class Pair { 
Object item; 
int weight; 
public Pair(Object item, int weight){ 
this,.item = item; 
this.weight = weight,; 


} 
public Object getIitem() { 
return item; 


public int getweight() 区 
return weight; 
} 


我 们 使 用 一 个 类 WeightRandom 表 示 囊 权重 的 选择 ， 如 代码 清单 7- 
9 所 不 。 


代码 清单 7-9 ”于 权重 的 选择 WeightRandom 


public class WeightRandom { 

private Pair[] options; 

private double[] cumulativeProbabilities; 

private Random rnd; 

public WeightRandom(Pair[] options){ 
this.options = options ， 
this.rnd = new Random( ); 
prepare(); 


private void prepare(){ 
int weights = 0; 
for(Pair pair : options){ 
weights += pair.getweight(); 
} 


cumulativeProbabilities = new double[options.1length]; 
int Sum = 0; 
for(int i = 0; i<options.Jlength; i++) { 
sum += options[i].getweight(); 
cumulativepProbabilities[i] = sum / (double)weights; 


} 


} 
public Object nextItem(){ 
double randomvalue = rnd.nextDouble(); 
int index = Arrays.binarySearch(cumulativeProbabilities, randomValue); 
if(index < 0) { 
index = -index-1; 
} 


return options[index].getIitem(); 


其 中 ，prepare () 方法 计算 每 个 选项 的 累计 概率 ， 保 存在 数组 
cumulativeProbabilities 中 ，nextItem () 方法 根据 权重 随机 选择 一 个 ， 


具体 殉 是 ， 首 先生 成 一 个 0 一 1 的 数 ， 然 后 使 用 二 分 查找 ， 如 采 没 找 
到 ， 返 回 结果 是 - 〈 插 入 点 ) -1， 所 以 -index-1 就 是 插入 点 ， 揪 入 点 的 
位 置 丈 对 应 选项 的 索引 。 


回 到 上 面 的 例子 ， 随 机 选择 10 次 ， 代 码 为 : 


Pair[] options = new Pair[]t{ 
new Pair("1 元 ",7)，new Pair("2 元 "，2)，mnew Pair("10 元 "，1) 


}; 

WeightRandom rnd = new WeightRandom(options); 

for(int i=0; i<10; i++ 
System.out.print(rnd.nextItem()+" "); 


} 


在 一 次 运行 中 ， 输 出 正好 符合 预期 ， 具 体 为 : 


1 元 1 元 1 元 2 元 1 元 10 元 1 元 2 元 1 元 1 元 


， 避 不 过 ， 需 要 说 明 的 是 ， 由 于 随机 ， 每 次 执行 结果 比例 不 一 定 正好 
有 等。 


7.6.7 抢 红 包 算 法 


我 们 都 知道 ， 微 信 可 以 抢 红包 ， 红 包 有 一 个 总 金额 和 总 数量 ， 领 
的 时 候 随机 分 配 金额 。 人 金额 是 怎么 随机 分 配 的 呢 ? 微 信和 具体 是 怎么 做 
的 ， 我 们 并 不 能 确切 地 知道 ， 但 如 下 思路 可 以 达到 该 效果 。 


维护 一 个 剩余 总 金额 和 总 数量 ， 分 配 时 ， 如 采 数 量 等 于 1， 直 接 返 
回 总 金额 ， 如 果 大 于 1， 则 计算 平均 值 ， 并 设 定 随机 最 大 值 为 平均 值 的 
两 倍 ， 然 后 取 一 个 随机 值 ， 如 果 随 机 值 小 于 0.01， 则 为 0.01， 这 个 随机 
值 就 是 下 一 个 的 红包 人 金额。 


我 们 来 看 代码 ， 如 代码 清单 7-10 所 示 ， 为 计算 方便 ， 金额 用 整数 
表示 ， 以 分 为 单位 。 


代码 清单 7-10” 抢 红包 算法 


public class RandomRedPacket { 

private int leftMoney;,; 

private int leftNum; 

private Random rnd; 

public RandomRedPacket(int total, int num){ 
this.1leftMoney = total; 
this.leftNum = num; 
this.rnd = new Random( ); 


public synchronized int nextMoney(){ 
if(this.1leftNum<=0){ 
throw new IllegalstateException(" 抢 光 了 ")，; 


} 
if(this.leftNum==1){ 
return this.1leftMoney; 


} 

double max = this, JeftMoney/this, JeftNum*2d ; 
int money = (int)(rnd.nextDouble()*max); 
money = Math.max(1, money); 

this.leftMoney -= money; 

this.leftNum --; 

return money; 


代码 比较 简 单 ， 束 不 解释 了 。 关 于 synchronized 修 饰 行 ， 此 处 可 以 
忽略 ， 留 得 第 15 草 介绍。 看 一 个 使 用 的 例子 ， 总 金额 为 10 元 ，10 个 红 
包 ， 代 码 如 下 : 


es 


RandomRedPacket redPacket = new RandomRedPacket(1000, 10); 

for(int i=0; i<10; i++){ 
System.out.print(redPacket.nextMoney()+" "); 

} 


< AS、 
一 次 输出 为 : 
136 48 90 151 36 178 92 18 122 129 


如 条 是 这 个 算法 ， 那 先 抢 好 ， 还 是 后 抢 好 呢 ? 移 抢 肯定 抢 不 到 特 
别 大 的 ， 不 过 ， 后 抢 也 不 一 定 会 ， 这 要 看 前 面 抢 的 金额 ， 剩 下 的 多 整 
有 可 能 抢 到 大 的 ， 剩 下 的 少 就 不 可 能 有 大 的 。 


7.6.8 ”北京 购车 授与 算法 


我 们 来 看 下 影响 很 多 人 的 北 泵 购车 摇号 ， 它 的 算法 是 怎样 的 呢 ? 
思路 大 概 古 这 样 的 : 


1) 每 期 摇号 前， 将 每 个 符合 摇号 资格 的 人 ， 分 配 一 个 从 0 到 总 数 
的 编号 ， 这 个 编号 是 公开 的 ， 比 如 总 人 数 为 2304567， 则 编号 为 0~~- 
2304566 。 


2) 摇号 第 一 步 是 生成 一 个 随机 种 子 数 ， 这 个 随机 种 子 数 在 摇号 当 
天 通过 一 定 流 程 生成 ， 整 个 过 程 由 公证 员 公 证 ， 束 是 生成 一 个 真正 的 
随机 数 。 

3) 种 子 数 生成 后 ， 然 后 就 是 循环 调用 类 似 Random.nextInt (int 
n) 方法 ， 生 成 中 签 的 编号 。 


编号 是 事先 确定 的 ， 种 子 数 是 当场 公证 随机 生成 的 ， 是 公开 的 ， 
0 任何 人 都 可 以 根据 公开 的 种 子 数 和 编号 验证 
32 六 HJ 二 与 “ 


7.6.9 ”小结 


本 节 介 绍 了 随机 ， 介 绍 了 Java 中 对 随机 的 支持 Math.random () 以 
及 Random 类 ， 介 绍 了 其 使 用 和 实现 原理 ， 同 时 ， 介 绍 了 随机 的 一 些 应 
用 场景 ， 包 括 随机 密码 、 洗 牌 、 市 权重 的 随机 选择 、 微 信 抢 红包 和 北 
京 购车 插 号 ， 完 整 的 代码 在 github 上 ， 地 址 为 
https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.commoncls.c34 下 。 


需要 说 明 的 是 ，Random 类 是 线程 安全 的 ， 也 就 是 说 ， 多 个 线程 可 
以 同时 使 用 一 个 Random 实 例 对 象 ， 不 过 ， 如 果 并 发 性 很 高 ， 会 产生 竞 
和 争 ， 这 时 ， 可 以 考虑 使 用 多 线程 库 中 的 ThreadLocalRandom 类 。 另 外 ， 
Java 类 库 中 还 有 一 个 随机 类 SecureRandom， 可 以 产生 安全 性 更 高 、 随 
机 性 更 强 的 随机 数 ， 用 于 安全 加 密 等 领域 。 


至 此 ， 关 于 常用 基础 类 残 介 绍 完了 。 我 们 深入 分 析 了 各 种 包 凑 
类 、String、String-Builder、Arrays、 日 期 和 时 间 、 以 及 随机 ， 这 些 都 
是 日 常 程 序 中 经 常用 到 的 功能 。 还 有 一 些 基础 类 ， 限 于 篇 幅 ， 束 不 介 
绍 了 ， 比 如 UUID、Math 和 Objects，UUID 用 于 随机 生成 需要 确保 唯一 


性 的 标识 从 ，Math 用 于 进行 数学 运算 ，Objects 包 含 一 些 操 作对 象 、 检 
查 条 件 的 方法 ， 具 体 可 参看 API 文 档 。 


之 前 革 广 中 ， 我 们 经 常 提 到 泛 型 这 一 概念 ， 它 到 属 是 什么 呢 ? 让 
我 们 下 一 章 详 细 探 讨 。 


第 三 部 分 ， 泛 型 与 容器 
-第 8 量 ” 沁 型 
:第 9 章 ”列表 和 队列 
:第 10 章 ”Map 和 Set 
第 11 划 ” 堆 与 优先 级 队列 


:第 12 草 ”通用 容 大 类 和 总 结 


第 8 章 ” 泛 型 


之 前 章节 中 我 们 多 次 提 到 过 沁 型 这 个 概念 ， 本 重 我 们 束 来 详细 讨 
论 Java 中 的 泛 型 。 昌 然 沁 型 的 基本 思维 和 概念 是 比较 简单 的 ， 但 它 有 
一 些 非常 令 人 费解 的 语法 、 细 方 ， 以 及 局 限 性 。 


后 续 章 下 我 们 会 介绍 各 种 容 船 类。 容 禹 类 可 以 说 是 日 单程 序 开发 
中 天 天 用 到 的 ， 没 有 容器 类 ， 难 以 想象 能 开发 什么 真正 有 用 的 程序 。 
而 容器 类 是 基于 泛 型 的 ， 不 理解 泛 型 ， 就 难以 深刻 理解 容器 类 。 那 泛 
型 到 底 是 什么 呢 ? 本 章 我 们 分 为 三 节 逐 步 来 讨论 : 8.1 节 主要 介绍 泛 型 
的 基本 概念 和 原理 ，8.2 市 重点 介绍 令 人 费解 的 通配符 ，8.3 节 介绍 一 些 
细节 和 谤 型 的 局 限 性 。 


8.1 基本 概念 和 原理 


之 前 我 们 一 直 强调 数据 类 型 的 概念 ，Java 有 8 种 基本 类 型 ， 可 以 定 
义 类 ， 类 相当 于 自 定义 数据 类 型 ， 类 之 间 还 可 以 有 组 合 和 继承 。 我 们 
也 介绍 了 接口 ， 其 中 提 到 ， 很 多 时 候 我 们 关心 的 不 是 类 型 ， 而 是 能 
为 针对 入口 和 能 力 编程， 不 仅 可 以 复 用 代码 ， 还 可 以 降低 福 合 ， 提 
高 灵活 性 。 


泛 型 将 接口 的 概念 进一步 延伸 ,，“ 泛 型 > 的 字面 意思 就 是 广泛 的 类 
型 。 类 、 接 口 和 方法 代码 可 以 应 用 于 非常 广泛 的 类 型 ， 代 码 与 它们 能 
够 操作 的 数据 类 型 不 再 绑 定 在 一 起 ， 同 一 父 代 码 可 以 用 于 多 种 数据 类 
降低 和 耦合， 而 且 可 以 提高 代码 的 可 读 
性 和 安全 性 。 


这 么 说 可 能 比较 抽象 ， 接 下 来 ， 我 们 通过 一 些 例子 逐步 进行 说 
ee 


8.1.1 一 个 简单 泛 型 类 


我 们 通过 一 个 位 单 的 例子 来 说 明 泛 型 类 的 基本 概念 、 基 本 原理 和 
泛 型 的 好 处 。 


1. 基 本 概念 
我 们 直接 来 看 代码 : 


public class Pair<T> { 
T first,; 
T second,; 
public Pair(T first, T second){ 
this,.first = first,; 
this,.second = second,; 


} 
public T getFirst() { 
return first,; 


} 
public T getSecond() { 
return second; 


Pair 就 是 一 个 泛 型 类 ， 与 普通 类 的 区 别 体现 在 : 

1) 类 名 后 面 多 了 一 个 <T>; 

2) first 和 second 的 类 型 都 是 T。 

TI 是 什么 昵 ? T 表 示 类 型 参数 ， 泛 型 束 是 类 型 参数 化 ， 处 理 的 数据 


类 型 不 是 固定 的 ， 而 是 可 以 作为 参数 传 和 人。 怎么 用 这 个 泛 型 类 ， 并 传 
递 类 型 参数 呢 ? 看 代码 : 


Pair<Integer> minmax = new Pair<Integer>(1,100); 
Integer min = minmax.getFirst(); 
Integer max = minmax.getSecond(); 


Pair<Integer> 中 的 Integer 就 是 传递 的 实际 类 型 参数 。Pair 类 的 代码 
和 它 处 理 的 数据 类 型 不 是 绑 定 的 ， 有 具体 类 型 可 以 变化 。 上 面 是 
Integer， 也 可 以 是 String， 比 如 : 


Pair<String> kv = new Pair<String>("name"," 老 马 " ) ; 


类 型 参数 可 以 有 多 个 ， Pair 类 中 的 first 和 second 可 以 是 不 同 的 类 
型 ， 多 个 类 型 之 间 以 逗号 分 隔 ， 来 看 改进 后 的 Pair 类 定义 : 


public class Pair<U, V> { 
U first; 
V second; 
public Pair(U first, V second){ 
this,.first = first,; 
this.second = second,; 


} 
public U getFirst() { 
return first,; 


} 
public V getSecond() { 
return second; 


可 以 这 样 使 用 : 
Pair<String,Integer> pair = new Pair<String,Integer>(" 老 马 ",100) ; 


<String，Iteger> 既 出 现在 了 声明 变量 时 ， 也 出 现在 了 new 后 面 ， 
比较 烦 琐 ， 从 Java 7 开始 ， 文 持 省 略 后 面 的 类 型 参数 ， 可 以 如 下 使 用 : 


Pair<String,Integer> pair = new Pair<>(" 老 马 ", 100); 


2. 基 本 原理 


泛 型 类 型 参数 到 底 是 什么 呢 ? 为 什么 一 定 要 定义 类 型 参数 呢 ? 定 
义 普通 类 ， 直 接 使 用 Object 不 就 行 了 吗 ? 比如 ，Pair 类 可 以 写 为 : 


public class Pair { 
Object first' 
Object Second 
public Pair(Object first, Object second ){ 
this,.first = first,; 
this.second = second,; 


} 
public Object getFirst() { 
return first,; 


} 
public Object getSecond() { 
return second; 


使 用 pair 的 代码 可 以 为 ; 


Pair minmax = new Pair(1,100); 

Integer min = (Integer)minmax.getrFirst(); 
Integer max = (Integer)minmax.getSecond(); 
Pair kv = new Pair("name", " 老 马 ")， 

String key = (String)kv.getrFirst(); 

String value = (String)kv.getSecond(); 


这 样 是 可 以 的 。 实 际 上 ，Java 汉 型 的 内 部 原理 就 是 这 样 的 。 


我 们 知道 ，Java 有 Java 编 译 右 和 Java 虚 拟 机 ， 编 译 姻 将 Java 源 代码 
转换 为 .class 文 件 ， 虚 拟 机 加 载 并 运行 .class 文 件 。 对 于 沁 型 类 ，Java 编 
译 絮 会 将 泛 型 代码 转换 为 普通 的 非 泛 型 代码 ， 束 人像 上 面 的 普通 Pair 类 
代码 及 其 使 用 代码 一 样 ， 将 类 型 参数 T 探 除 ， 苦 换 为 Object， 插 入 必要 
的 强制 类 型 转换 。Java 虚 拟 机 实际 执行 的 时 候 ， 它 是 不 知道 泛 型 这 回 
事 的 ， 只 知道 普通 的 类 及 代码 。 


再 强调 一 下 ，Java 泛 型 是 通过 近 除 实现 的 ， 类 定义 中 的 类 型 参数 
如 TI 会 被 奉 换 为 Object， 在 程序 运行 过 程 中 ， 不 知道 泛 型 的 实际 类 型 参 
数 ， 比 如 Pair<Integer>， 运 行 中 只 知道 Pair， 而 不 知道 Integer。 认识 到 
这 一 点 是 非常 重要 的 ， 它 有 助 于 我 们 理解 Java 泛 型 的 很 多 限制 。 


Java 为 什么 要 这 么 设计 呢 ? 这 型 是 Java 5 以 后 才 文 持 的 ， 这 人 么 设计 
是 为 了 兼容 性 而 不 得 已 的 一 个 选择 。 


3. 泛 型 的 好 处 

既然 只 使 用 普通 类 和 Object 束 可 以 ， 而 且 沁 型 最 后 也 转换 为 了 普 
通 类 ， 那 为 什么 还 要 用 泛 型 呢 ? 或 者 说 ， 池 型 到 辰 有 什么 好 处 呢 ? 泛 
型 主要 有 了 两 个 好 处 ， 

更 好 的 安全 性 。 

更 好 的 可 读 性 。 

语言 和 程序 设计 的 一 个 重要 目标 是 将 bug 尺 量 消炎 在 摇 饥 里 ， 能 消 
火 在 写 代 码 的 时 候 ， 束 不 要 等 到 代码 写 完 程序 运行 的 时 候 。 只 使 用 


0 


Pair pair = new Pair(" 老 马 ",1); 
Integer id = (Integer)pair,getFirst()， 
String name = (String)pair,getSecond( ) ， 


看 出 问题 了 吗 ? 写 代 码 时 不 小 心 把 类 型 弄 错 了 ， 不 过 ， 代 码 编译 
时 是 没有 任何 问题 的 ， 但 运行 时 程序 抛 出 了 类 型 转换 异常 
ee 则 不 可 能 犯 这 个 错误 ， 比 如 下 面 
、 伍 : 


Pair<String, Integer> pair = new Pair<>(" 老 马 ",1); 
在 和 :又 攻 器 


Integer id = pair.getFirst(); // 有 编译 错 
String name = pair.getSecond(); // 有 编译 错误 


开发 环境 (如 Edlipse) 会 提示 类 型 错误 ， 即 使 没有 好 的 开发 环 
境 ， 编 译 时 Java 编 译 器 也 会 提示 。 这 称 之 为 类 型 安全 ， 也 束 是 说 ， 通 
过 使 用 沁 型 ， 开 发 环境 和 编译 器 能 确 你 不 会 用 错 类 型 ， 为 程序 多 设置 
一 道 安 全 防护 网 。 使 用 泛 型 ， 还 可 以 省 去 烦琐 的 强制 类 型 转换 ， 再 加 
上 了 明确 的 类 型 信息 ， 代 码 可 读 性 也 会 更 好 。 


J | 


8.1.2 容器 类 


泛 型 类 最 利 见 的 用 途 是 作为 容 邵 类 。 所 谓 容 需 类 ， 简 单 地 说 ， 欢 
征 容 纳 并 管理 多 项 数据 的 类 。 数 组 束 是 用 来 管理 多 项 数据 的 ， 但 数组 
有 很 多 限制 ， 比 如 ， 长 度 固 定 ， 插 入 、 删 除 操 作 效率 比较 低 。 计 算 机 
技术 有 一 门 课 程 叫 数据 结构 ， 专 门 讨 论 管理 数据 的 各 种 方式 。 


这 些 数 据 结构 在 Java 中 的 实现 主要 就 古 Java 中 的 各 种 容 絮 类 ， 其 
至 Java 泛 型 的 引入 主要 也 是 为 了 更 好 地 文 持 Java 容 硕 。 后 续 章 世 我 们 
会 详细 讨论 主要 的 Java 容 器 ， 本 广 先 实现 一 个 非常 简单 的 Java 容 右 ， 
来 解释 泛 型 的 一 些 概 念 。 


我 们 来 实现 一 个 位 单 的 动态 数组 容器 。 所 谓 动 态 数 组 ， 就 古 长 度 
可 变 的 数组 。 底 层 数 组 的 长 度 当然 是 不 可 变 的 ， 但 我 们 提供 一 个 类 ， 
对 这 个 类 的 使 用 者 而 言 ， 好 像 就 古 一 个 长 度 可 变 的 数组 。Java 容 右 中 
0 
8-1BT 不 。 


代码 清单 8-1 动态 数组 DynamicArray 


public class DynamicArray<E> { 
private static final int DEFAULT_CAPACITY = 10; 
private int size; 
private Object[] elementData; 
public DynamicArray() { 
this.elementData = new Object[DEFAULT_CAPACITY]; 


private void ensureCapacity(int minCapacity) { 
int oldCapacity = elementData.1length, 
if(oldCapacity >= minCapacity)t 


return; 


int newCapacity = oldCapacity * 2， 
if(newCapacity < minCapacity) 
newCapacity = minCapacity; 
elementData = Arrays.copyof(elementData, newCapacity); 


} 

public void add(E e) { 
ensureCapacity(size + 1); 
elementData[size++] = e; 


} 
public E get(int index) { 
return (E)elementData[index]; 


public int size() { 
return size; 


public E set(int index, E element) { 
E oldValue = get(index); 
elementData[index] = element,; 
return oldValue; 


DynamicArray 束 是 一 个 动态 数组 ， 内 部 代码 与 我 们 之 前 分 析 过 的 
StringBuilder 类 似 ， 通 过 ensureCapacity 方 法 来 根据 需要 扩展 数组 。 作 
为 一 个 容器 类 ， 它 容纳 的 数据 类 型 是 作为 参数 传递 过 来 的 ， 比 如 ,在 
放 Double 类 型 : 


DynamicArray<Double> arr = new DynamicArray<Double>(); 
Random rnd = new Random( ); 
int size = 1i+rnd.nextInt(100); 
for(int i=0; i<size; I++){ 
arr.add(Math.random( )); 


Double d = arr.get(rnd.nextInt(size)); 


这 束 是 一 个 们 单 的 容器 类 ， 适 用 于 各 种 数据 类 型 ， 且 类 型 安全 。 
后 文 还 会 以 Dynamic-Array 为 例 进行 扩展 ， 以 解释 泛 型 概念 。 


具体 的 类 型 还 可 以 是 一 个 泛 型 类 ， 比 如 ， 可 以 这 样 写 : 


DynamicArray<Pair<Integer,String>> arr = new DynamicArray<>() 


ar 表示 一 个 动态 数组 ， 每 个 元 素 是 Pair<Integer，String> 类 型 。 


8.1.3” 泛 型 方法 


除了 泛 型 类 ， 方 法 也 可 以 是 泛 型 的 ， 而且， 一 个 方法 是 不 古 泛 型 
的 ， 与 它 所 在 的 类 是 不 是 泛 型 没有 什么 关系 。 我 们 看 个 例子 : 


public static <T> int indexof(T[] arr, T elm){ 
for(int i=0; i<arr.length; i++){ 
if(arr[i].equals(elm)){ 
return 工 ; 
} 


return -1; 


} 


这 个 方法 驶 是 一 个 泛 型 方法 ， 类 型 参数 为 T， 放 在 返回 值 前 面 ， 
它 可 以 如 下 调用 : 


indexof (new Integer[]{1,3,5}, 10) 


也 可 以 如 下 调用 : 


indexof(new String[]{"hello"," 老 马 ", "编程 "}，" 老 马 ") 


indexOf 表 示 一 个 算法 ， 在 给 定数 组 中 寻找 某 个 元 素 ， 这 个 算法 的 
基本 过 程 与 具体 数据 类 型 没有 什么 关系 ， 通 过 泛 型 ， 它 可 以 方便 地 应 
用 于 各 种 数据 类 型 ， 且 由 编译 器 保证 类 型 安全 。 


与 沁 型 类 一 样 ， 类 型 参数 可 以 有 多 个 ， 以 逗号 分 隅 ， 比 如 : 


public static <U,V> Pair<U,V> makePair(U first, V second){ 
Pair<U,V> pair = new Pair<>(first, second); 
return pair,; 


} 


与 泛 型 类 不 同 ， 调 用 方法 时 一 般 并 不 需要 特意 指 
际 类 型 ， 比 如 调用 make-Pair: 


类 型 参数 的 实 


ml 


makePair(1," 老 马 ") 


并 不 需要 告诉 编译 器 U 的 类 型 是 Integer，V 的 类 型 是 String，Java 编 
译 妖 可 以 目 动 推 新 出 来 。 


8.1.4 泛 型 接口 


接口 也 可 以 是 泛 型 的 ， 我 们 之 前 介绍 过 的 Comparable 和 
Comparator 接 口 都 是 泛 型 的 ， 它 们 的 代码 如 下 : 


public interface Comparable<T> { 
public int compareTo(T 0); 


public interface Comparator<T> { 
int compare(T o1, T 02); 
boolean equals(Object obj); 


与 前 面 一 样 ，I 是 类 型 参数 。 实 现 接口 时 ， 应 该 指定 具体 的 类 
型 ， 比 如 ， 对 Integer 类 ， 实 现代 码 是 : 


public final class Integer extends Number implements Comparable<Integer>{ 
public int compareTo(Integer anotherIinteger) { 
return compare(this.value, anotherIinteger .value); 


} 
// 其 他 代码 


通过 implements Comparable<Integer> ，Integer 实 现 了 Comparable 接 
口 ， 指 定 了 实际 类 型 参数 为 Integer， 表 示 Integer 只 能 与 Integer 对 象 进 行 
比较 。 


再 看 Comparator 的 一 个 例子 ，String 类 内 部 一 个 Comparator 的 接口 
实现 为 : 


private static class CaseInsensitiveComparator 
implements Comparator<String> { 
public int compare(String si, String s2) { 
// 省 略 主体 代码 
} 


这 里 ， 指 定 了 实际 类 型 参数 为 String。 
8.1.5 “类 型 参数 的 限定 


在 之 前 的 介绍 中 ， 无 论 是 沁 型 类 、 汉 型 方法 还 是 泛 型 接口 ， 关 于 
类 型 参数 ， 我 们 都 知之 甚 少 ， 只 能 把 它 当 作 Object， 但 Java 文 持 限 定 这 
个 参数 的 一 个 上 界 ， 也 束 是 说 ， 参 数 必须 为 给 定 的 上 界 类 型 或 其 于 类 
型 ， 这 个 限定 是 通过 extends 天 键 字 来 表示 的 。 这 个 上 界 可 以 是 某 个 有 具 
体 的 类 或 者 某 个 具体 的 接口 ， 也 可 以 是 其 他 的 类 型 参数 ， 我 们 逐个 介 
绍 其 应 用 。 


1. 上 界 为 某 个 具体 类 


比如 ， 上 面 的 Pair 类 ， 可 以 定义 一 个 子 类 NumberPair， 限 定 两 个 类 
型 参数 必须 为 Number， 代 码 如 下 : 


public class NumberPair<U extends Number, V extends Number> 
extends Pair<U, V> { 
public NumberPair(U first, V second) { 
super(first, second); 


限定 类 型 后 ， 就 可 以 使 用 该 类 型 的 方法 了 。 比 如 ， 对 于 
NumberPair 类 ，first 和 second 变 量 就 可 以 当 作 Number 进 行 处 理 了 。 比 
如 可 以 定义 一 个 求 和 方法 ， 如 下 所 示 : 


public double sum(){ 
return getFirst().doubleVvalue() +getSecond().doubleValue(); 


可 以 这 么 用 : 


NumberPair<Integer, Double> pair = new NumberPair<>(10, 12.34); 
double sum = pair.sum(); 


限定 类 型 后 ， 如 采 类 型 使 用 错误 ， 编 译 器 会 提示。 指定 边界 后 ， 
类 型 控 除 时 束 不 会 转换 为 Object 了 ， 而 十 会 转换 为 它 的 边界 类 型 ， 这 
也 是 容易 理解 的 。 
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”在 泛 型 方法 中 ， 一 种 常见 的 场景 是 限定 类 型 必须 实现 Comparable 
接口 ， 我 们 来 看 代码 : 


public static <T extends Comparable> T max(T[] arr){ 
T max = arr[0]; 
for(int i=1; i<arr.length; i++){ 
if(arr[i].compareTo(max)>0){ 
max = arr[I]' 


} 


return max; 


} 


max 方 法 计算 一 个 泛 型 数组 中 的 最 大 全 " 计算 最 大 值 需要 进行 元 
素 之 间 的 比较 ， 要 求 元 素 实现 Comparable 接 口 ， 所 以 给 类 型 参数 设置 
了 一 个 上 边界 Comparable，T 必 须 实 现 Comparable 接 口 。 


不 过 ， 直 接 这 么 编写 代码 ，Java 中 会 给 一 个 警告 信息 ， 因 为 
Comparable 是 一 个 泛 型 接口 ， 它 也 需要 一 个 类 型 参数 ， 所 以 完整 的 方 
法 声明 应 该 是 : 


public static <T extends Comparable<T>> T max(T[] arr){ 
// 主 体 代 码 
} 


<T extends Comparable<T>> 是 一 种 令 人 费解 的 语法 形式 ， 这 种 形 
式 称 为 递归 类 型 限制 ， 可 以 这 么 解读 ，T 表 示 一 种 数据 类 型 ,必须 实 
现 Comparable 接 口 ， 且 必须 可 以 与 相同 类 型 的 元 素 进 行 比较 。 


3. 上 界 为 其 他 类 型 参数 
上 面 的 限定 都 是 指定 了 一 个 明确 的 类 或 接口 ，Java 文 持 一 个 类 型 


参数 以 另 一 个 类 型 参数 作为 上 界 。 为 什么 需要 这 个 昵 ? 我 们 看 个 例 
子 ， 给 上 面 的 DynamicArray 类 增加 一 个 实例 方法 addAl1， 这 个 方法 将 


人 直觉 上 ， 代 码 可 以 如 
写 ， 


public void addAll(DynamicArray<E> c) { 
for(int i=0; i<c.size; i++){ 
add(c.get(i)); 


但 这 么 写 有 一 些 局 限 性 ， 我 们 看 使 用 它 的 代码 : 


DynamicArray<Number> numbers = new DynamicArray<>(); 
DynamicArray<Integer> ints = new DynamicArray<>(); 
ints.add(100); 

ints.add(34); 


numbers .addAlL1(ints)， // 会 提示 编译 错误 


numbers 是 一 个 Number 类 型 的 容 姻 ，ints 是 一 个 Integer 类 型 的 容 
俐 ， 我 们 希望 将 ints 添 加 到 numbers 中 ， 因 为 Integer 是 Number 的 子 类 ， 
应 该 说 ， 这 是 一 个 合理 的 需求 和 操作 。 


但 Java 会 在 numbers.addAll (ints) 这 行 代码 上 提示 编译 错误 : 
addAl 需 要 的 参数 类 型 为 DynamicArray<Number>， 而 传递 过 来 的 参数 


类 型 为 DynamicArray<Integer>， 不 适用 。Integer 是 Number 的 子 类 ， 怎 
么 会 不 适用 呢 ? 


事实 殉 是 这 样 ， 确 实 不 适用 ， 而 且 是 很 有 道理 的 ， 假 设 适用 ， 我 
1 下 A 


DynamicArray<Integer> ints = new DynamicArray<>(); 
DynamicArray<Number> numbers = ints; // 假 设 这 行 是 合法 的 
numbers.add(new Double(12.34)); 


那 最 后 一 行 就 是 合法 的 ， 这 时 ， DynamicArray<Integer> 中 就 会 出 
现 Double 类 型 的 值 ， 而 这 显然 破坏 了 Java 泛 型 天 于 类 型 安全 的 保证 。 


我 们 强调 一 下 ， 虽 然 Integer 是 Number 的 子 类 ， 但 
DynamicArray<Integer> 并 不 是 DynamicArray<Number> 的 子 类 ， 
DynamicArray<Integer> 的 对 象 也 不 能 赋值 给 Dynamic-Array<Number> 


的 变量 ， 这 一 点 初 看 上 去 是 违反 直觉 的 ， 但 这 是 事实 ， 必 须要 理解 这 
-上 占 。 

了 我 们 的 需求 是 合理 的 ， 将 Integer 添 加 到 Number 容 姨 中 并 没 
有 问题 。 这 个 问题 可 以 通过 类 型 限定 来 解决 : 


public <T extends E> void addAll(DynamicArray<T> c) { 
for(int i=0; i<c.size; i++){ 
add(c.get(i)); 


E 是 DynamicArray 的 类 型 参数 ，T 是 addAll 的 类 型 参数 ，T 的 上 界 
限定 为 E， 这 样 ， 下 面 的 代码 惑 没 有 问题 了 : 


DynamicArray<Number> numbers = new DynamicArray<>(); 
DynamicArray<Integer> ints = new DynamicArray<>(); 
ints.add(100); 

ints.add(34); 

numbers.addAll(ints); 


对 于 这 个 例子 ， 这 种 写法 有 点 烦琐 ，8.2 市 中 我 们 会 介绍 一 种 简化 


的 方式 。 
.16 才智 


泛 型 是 计算 机 程序 中 一 种 重要 的 思维 方式 ， 它 将 数据 结构 和 算法 
与 数据 类 型 相 分 离 ， 使 得 同一 套数 据 结构 和 算法 能 够 应 用 于 各 种 数据 
类 型 ， 而 且 可 以 保证 类 型 安全 ， 提 高 可 读 性 。 在 Java 中 ， 泛 型 广泛 应 
用 于 各 种 容 右 类 中 ， 理 解 泛 型 是 深刻 理解 容器 的 基础 。 


本 下 介绍 了 泛 型 的 基本 概念 ， 包 括 泛 型 类 、 泛 型 方法 和 泛 型 接 
口 ， 关 于 类 型 参数 ， 我 们 介绍 了 多 种 上 界限 定 ， 限 定 为 某 具 体 类 、 某 
具体 接口 或 其 他 类 型 参数 。 泛 型 类 最 常见 的 用 途 是 容器 类 ， 我 们 实现 
了 一 个 简单 的 容器 类 DynamicArray， 以 解释 泛 型 概念 。 


在 Java 中 ， 泛 型 是 通过 类 型 控 除 来 实现 的 ， 它 是 Java 编 译 器 的 概 
念 ，Java 虚 拟 机 运行 时 对 泛 型 基本 一 无 所 知 ， 理 解 这 一 点 是 很 重要 


的 ， 它 有 助 于 我 们 理解 Java 泛 型 的 很 多 局 限 性 。 


天 于 泛 型 ，Java 中 有 一 个 通配符 的 概念 ， 用 得 很 广泛 ， 但 语法 非 
和 


8.2 ”解析 通配符 


本 节 主 要 讨论 泛 型 中 的 通配符 概念 。 通 配 符 有 着 令 人 费解 和 混淆 
的 语法 ， 但 通配符 大 量 应 用 于 Java 容 侨 类 中 ， 它 到 底 是 什么 ?下 面 我 
们 逐步 来 解析 。 


8.2.1 更 人 简 消 的 参数 类 型 限定 


在 8.1 广 最 后 ， 我 们 提 到 一 个 例子 ， 为 了 将 Integer 对 象 添 加 到 
Number 容 需 中 ， 我 们 的 类 型 参数 使 用 了 其 他 类 型 参数 作为 上 界 ， 我 们 
提 到 ， 这 种 写法 有 点 烦琐 ， 它 可 以 替换 为 更 为 简洁 的 通配符 形式 : 


public void addAll(DynamicArray<? extends E> C) { 
for(int i=0; i<c.size; i++){ 
add(c.get(i)); 
} 


} 


这 个 方法 没有 定义 类 型 参数 ，c 的 类 型 是 DynamicArray<? extends 
E>，? 表示 通配符 ，<? extends E> 表示 有 限定 通配符 ， 匹配 E 或 E 的 
某 个 子 类 型 ， 具 体 什么 子 类 型 是 未 知 的 。 使 用 这 个 方法 的 代码 不 需要 
做 任何 改动 ， 还 可 以 是 : 


DynamicArray<Number> numbers = new DynamicArray<>(); 
DynamicArray<Integer> ints = new DynamicArray<>(); 
ints.add(100); 

ints.add(34); 

numbers.addAll(ints); 


这 里 ，E 是 Number 类 型 ，DynamicArray<? extends E> 可 以 匹配 
DynamicArray<IntegeI>“。 


那么 问题 来 了 ， 同 样 是 extends 关 键 字 ， 同 样 应 用 于 泛 型 ，<T 
extends E> 和 <? extends E> 到 底 有 什么 关系 ? 它们 用 的 地 方 不 一 样 ， 我 
们 解释 一 下 : 


1) <T extends E> 用 于 定义 类 型 参数 ， 它 声明 了 一 个 类 型 参数 T， 
可 放 在 泛 型 类 定义 中 类 名 后 面 、 沁 型 方法 返回 值 前 面 。 


2) <? extends E> 用 于 实例 化 类 型 参数 ， 它 用 于 实例 化 泛 型 变量 
中 的 类 型 参数 ， 只 是 这 个 具体 类 型 是 未 知 的 ， 只 知道 它 是 E 或 E 的 某 个 
天 型 


虽然 它们 不 一 样 ， 但 两 种 写法 经 第 可 以 达成 相同 目标 ， 比 如 ， 前 
面 例子 中 ， 下 面 两 种 写法 部 可 以 : 


public void addAll(DynamicArray<? extends E> c) 
public <T extends E> void addAll(DynamicArray<T> c) 


那么 ， 到 底 应 该 用 哪 种 形式 呢 ? 我 们 先进 一 步 理解 通配符 ， 然 后 
再 解释 。 


8.2.2 ”理解 通配符 


除了 有 限定 通 配 答 ， 还 有 一 种 通配符 ， 形 如 DynamicArray<? >， 
"我们 来 看 个 例子 ， 在 DynamicArray 中 查找 指定 元 
系 ， 代 的 如 下 : 


public static int indexof(DynamicArray<?> arr, Object elm){ 
for(int i=0; i<arr.size(); i++){ 
if(arr.get(i).equals(elm)){ 
return 工 ; 


} 


return -1; 


} 


其 实 ， 这 种 无 限定 通配符 形式 也 可 以 改 为 使 用 类 型 参数 。 也 就 是 
说 ， 下 面 的 写法 : 


public static int indexof (DynamicArray<?> arr, Object elm) 


可 以 改 为 : 


public static <T> int indexof(DynamicArray<T> arr, Object elm) 


不 过 ， 通 配 符 形式 更 为 人 简洁。 虽然 通配符 形式 更 为 简 消 ， 但 上 面 
0 只 能 读 ， 不 能 写 。 怎么 理解 呢 ? 看 
和 例子. 


DynamicArray<Integer> ints = new DynamicArray<>( ) ; 
DynamicArray<? extends Number> numbers = ints; 
Integer a = 200; 

numbers.add(a); // 错 误 ! 

numbers.add((Number)a); // 错 误 ! 
numbers.add((0bject)a); // 错 误 ! 


三 种 add 方 法 都 是 非法 的 ， 无 论 是 Integer， 还 是 Number 或 Object， 
编译 器 都 会 报错 。 为 什么 呢 ? 问号 就 是 表示 类 型 安全 无 知 ，? extends 
Number 表 示 是 Number 的 某 个 子 类 型 ， 但 不 知道 具体 子 类 型 ， 如 果 人 多 
许 写 入 ，Java 束 无 法 确保 类 型 安全 性 ， 所 以 干脆 禁止 。 我 们 来 看 个 例 
子 ， 看 看 如 果 人 允许 写 入 会 发 生 什 么 : 


DynamicArray<Integer> ints = new DynamicArray<>(); 
DynamicArray<? extends Number> numbers = ints; 
Number n = new Double(23.0); 

Object 0 = new String("hello world"); 
numbers.add(n); 

numbers.add(o); 


如 果 人 允许 写 入 Object 或 Number 类 型 ， 则 最 后 两 行 编译 就 是 正确 
的 ， 也 就 是 说 ，Java 将 允许 把 Double 或 String 对 象 放 入 Integer 容 器 ， 这 
显然 违背 了 Java 天 于 类 型 安全 的 承诺 。 


大 部 分 情况 下 ， 这 种 限制 是 好 的 ， 但 这 使 得 一 些 理 应 正确 的 基本 
操作 无 法 完成 ， 比 如 交换 两 个 元 素 的 位 置 ， 看 如 下 代码 : 


public static void swap(DynamicArray<?> arr, int i, int j){ 
Object tmp = arr.get(i); 
arr.set(i, arr.get(j)); 
arr.set(j, tmp); 


这 个 代码 看 上 去 应 该 是 正确 的 ， 但 Java 会 提示 编译 错误 ， 两 行 set 
0 。 不过， 借助 带 类 型 参数 的 沁 型 方法 ， 这 个 问题 可 以 
中 下 年 


private static <T> void swapInternal(DynamicArray<T> arr, int i, int ]){ 
T tmp = arr.get(i); 
arr.set(i, arr.get(j)); 
arr.set(j, tmp); 


public static void swap(DynamicArray<?> arr, int i, int j)t{ 
swapInternal(arr, i, j); 


swap 可 以 调用 swapInternal ， 而 市 类 型 参数 的 swapInternal 可 以 写 
入 。Java 雁 器 夫 中 瑞 有 类 似 这 样 的 用 法 ， 公 共 的 API 是 通配符 形式 ， 形 
式 更 简单 ， 但 内 部 调用 带 类 型 参数 的 方法 。 


除了 这 种 需要 写 的 场合 ， 如 果 参 数 类 型 之 间 有 依赖 关系 ， 也 只 能 
用 类 型 参数 ， 比 如 ， 将 src 容 器 中 的 内 容 复 制 到 dest 中 : 


public static <D,S extends D> void copy(DynamicArray<D> dest, 
DynamicArray<S> Src){ 
for(int i=0; i<src.size(); I++){ 
dest.add(src.get(i)); 


S 和 DD 有 依赖 关系， 要 么 相同 ， 要 么 S 是 D 的 子 类， 否则 类 型 不 兼 
容 ， 有 编译 错误 。 不 过 ， 上 面 的 声明 可 以 使 用 通配符 简化 ， 两 个 参数 
可 以 位 化 为 一 个 ， 如 下 所 示 : 


public static <D> void copy(DynamicArray<D> dest, 
DynamicArray<? extends D> src){ 
for(int i=0; i<src.size(); i++){ 
dest.add(src.get(i)); 


如 条 返回 值 依赖 于 类 型 参数 ， 也 不 能 用 通配符 ， 比 如 ， 计 算 动 态 
数组 中 的 最 大 值 ， 如 下 所 示 : 


public static <T extends Comparable<T>> T max(DynamicArray<T> arr){ 
T max = arr.get(0); 
for(int i=1; i<arr.size(); i++){ 
if(arr.get(i).compareTo(max)>0){ 
max = arr.get(i); 


} 


return max; 


} 


上 面 的 代码 殊 难 以 用 通配符 代 兰 。 
现在 我 们 再 来 看 泛 型 方法 到 底 应 该 用 通配符 的 形式 还 是 加 类 型 参 
数 。 两 者 到 底 有 什么 关系? 我 们 总 结 如 下 。 


1) 通配符 形式 都 可 以 用 类 型 参数 的 形式 来 替代 ， 通 配 符 能 做 的 ， 
用 类 型 参数 都 能 做 。 


2) 通配符 形式 可 以 减少 类 型 参数 ， 形 式 上 往往 更 为 简单 ， 可 读 性 
也 更 好 ， 所 以 ， 能 用 通配符 的 束 用 通配符 。 

3) 如 采 类 型 参数 之 间 有 依赖 关系 ， 或 者 返回 值 依赖 类 型 参数 ， 或 
者 需要 写 操 作 ， 则 只 能 用 类 型 参数 。 


4) 通配符 形式 和 类 型 参数 往往 配合 使 用 ， 比 如 ， 上 面 的 copy 方 
7- 使 用 通配符 表达 依赖 ， 并 接受 更 广泛 的 数 


8.2.3” 超 类 型 通配符 


还 有 一 种 通配符 ， 与 形式 <? extends E> 正好 相反 ， 它 的 形式 为 
<? super E>， 称 为 超 类 型 通配符 ， 表 示 E 的 某 个 父 类 型 。 它 有 什么 用 
呢 ? 有 了 它 ， 我 们 就 可 以 更 灵活 地 写 入 了 。 


如 果 没 有 这 种 语法 ， 写 入 会 有 一 些 限制 。 来 看 个 例子 ， 我 们 给 
DynamicArray 添 加 一 个 方法 : 


public void copyTo(DynamicArray<E> dest){ 
for(int i=0; i<size; I++){ 
dest.add(get(i1)); 


这 个 方法 也 很 侧 单 ， 将 当前 容器 中 的 元 素 深 加 到 传 入 的 目标 容器 
中 。 我 们 可 能 希望 这 么 使 用 : 


DynamicArray<Integer> ints = new DynamicArray<Integer>(); 
ints.add(100); 

ints.add(34); 

DynamicArray<Number> numbers = new DynamicArray<Number>(); 
ints.copyTo(numbers); 


Integer 是 Number 的 子 类 ， 将 Integer 对 象 拷贝 入 Number 容 右 ， 这 种 
用 法 应 该 是 合情合理 的 ， 但 Java 会 提示 编译 错误 ， 理 由 我 们 之 前 也 说 
过 了 ， 期 望 的 参数 类 型 是 Dynamic-Array<Integer>， 
DynamicArray<Number> 并 不 适用 。 


如 之 前 所 说 ， 一 般 而 言 ， 不 能 将 DynamicArray<Integer> 看 作 
DynamicArray<Number>， 但 我 们 这 里 的 用 法 是 没有 问题 的 ，Java 解 决 
这 个 问题 的 方法 就 是 超 类 型 通配符 ， 可 以 将 copyTo 代 码 改 为 : 


public void copyTo(DynamicArray<? super E> dest){ 
for(int i=0; i<size; I++){ 
dest.add(get(i)); 


} 
} 


这 样 ， 束 没有 问题 了 。 
超 类 型 通配符 男 一 个 常用 的 场合 是 Comparable/Comparator 按 口 。 


同样 ， 我 们 先 来 看 下 如 采 不 使 用 会 有 什么 限制 。 以 前 面 计算 最 大 值 的 
方法 为 例 ， 它 的 方法 声明 是 : 


public static <T extends Comparable<T>> T max(DynamicArray<T> arr) 


这 个 声明 有 什么 限制 呢 ? 举 个 徐 单 的 例子 ， 有 两 个 类 Base 和 
Child，Base 的 代码 是 : 


Class Base implements Comparable<Base>{ 
private int Sortorder ， 
public Base(int Sortorder) { 
this,Ssortorder = sortOrder,; 


QOverride 
public int compareTo(Base 0) { 
if(sortorder < 0o.Ssortorder){ 
return -1; 
}else if(sortOrder > 0,.Ssortorder){ 
return 1; 
}elsef{ 
return ©; 


Base 代 码 很 简单 ， 实 现 了 Comparable 接 口 ， 根 据 实 例 变量 
sortOrder 进 行 比 较 。Child 代 码 是 : 


Class Child extends Base { 
public Child(int sortOrder) { 
super (sortOrder); 


这 里 ，Child 非 常 简单， 只 是 继承 了 Base。 注 意 : Child 没 有 重新 实 
现 Comparable 接 口 ， 因 为 Child 的 比较 规则 和 Base 是 一 样 的。 我 们 可 能 
布 望 使 用 前 面 的 max 方 法 操作 Child 容 器 ， 如 下 所 示 : 


DynamicArray<Child> childs = new DynamicArray<Child>(); 
childs.add(new Child(20)); 

childs.add(new Child(80)); 

Child maxChild = max(childs); 


遗憾 的 是 ，Java 会 提示 编译 错误 ， 类 型 不 匹配 。 为 什么 不 匹配 
呢 ? 我 们 可 能 会 认为 ，Java 会 将 max 方 法 的 类 型 参数 T 推 新 为 Child 类 
型 ， 但 类 型 T 的 要 求 是 extends Comparable<T> ， 而 Child 并 没有 实现 
Comparable<Child>， 它 实现 的 是 Comparable<Base>。 


但 我 们 的 需求 是 合理 的 ，Base 类 的 代码 已 经 有 了 天 于 比较 所 需 


的 全 部 数据 ， 它 应 该 可 以 用 于 比较 Child 对 象 。 解 决 这 个 问题 的 方法 ， 
忠 古 修改 max 的 方法 声明 ， 使 用 超 类 型 通配符 ， 如 下 所 示 : 


public static <T extends Comparable<? super T>> T max(DynamicArray<T> arr) 


这 么 修改 一 下 避 ® 可 以 了 ， 这 种 写法 比较 抽象 ， 将 T 奉 换 为 Child， 
束 是 : 


Child extends Comparable<? super Child> 


<? super Child> 可 以 匹配 Base， 所 以 整体 天 是 匹配 的 。 
我 们 比较 一 下 类 型 参数 限定 与 超 类 型 通配符 ， 类 型 参数 限定 只 有 


extends 形 式 ， 没 有 super 形 式 ， 比 如 ， 前 面 的 copyTo 方 法 的 通配符 形式 
的 声明 为 : 


public void copyTo(DynamicArray<? super E> dest) 


如 果 类 型 参数 限定 支持 super 形 式 ， 则 应 该 是 : 


public <T super E> void copyTo(DynamicArray<T> dest) 


事实 是 ，Java 并 不 支持 这 种 语法 。 


前 面 我 们 说 过 ， 对 于 有 限定 的 通配符 形式 <? extends E>， 可 以 用 
类 型 参数 限定 替代 ， 但 是 对 于 类 似 上 面 的 超 类 型 通配符， 则 无 法 用 类 
型 参数 替代 。 


8.2.4 通配符 比较 


本 下 介绍 了 泛 型 中 的 三 种 通配符 形式 <? >、<? super E> 和 <? 
extends E>， 并 分 析 了 与 类 型 参数 形式 的 区 别 和 联系 ， 它 们 比较 容易 混 
淆 ， 我 们 总 结 比 较 如 下 : 


om 它们 的 目的 都 是 为 了 使 方法 接口 更 为 灵活 ， 可 以 接受 更 为 广泛 


2) <? super E> 用 于 灵活 写 入 或 比较 ， 使 得 对 象 可 以 写 入 父 类 型 
的 容 絮 ， 使 得 父 类 型 的 比较 方法 可 以 应 用 于 子 类 对 象 ， 它 不 能 被 类 型 
参数 形式 替代 。 


3) <? > 和 <? extends E> 用 于 灵活 读 取 ， 使 得 方法 可 以 读 取 E 或 E 
的 任意 子 类 型 的 容器 对 象 ， 它 们 可 以 用 类 型 参数 的 形式 替代 ， 但 通 配 
符 形式 更 为 简洁 。 


Java 容 姨 类 的 实现 中 ， 有 很 多 使 用 通配符 的 例子 ， 比 如 ， 类 
Collections 中 就 有 如 下 方法 : 


public static <T extends Comparable<? super T>> void sort(List<T> list) 
public static <T> void sort(List<T> list, Comparator<? super T> c) 
public static <T> void copy(List<? super T> dest, List<? extends T> src) 
public static <T> T max(Collection<? extends T> coll, 

Comparator<? super T> comp) 


通过 前 面 两 季 ， 我 们 应 该 可 以 理解 这 些 方法 声明 的 合 义 了 。 关 于 
泛 型 ， 还 有 一 些 细节 以 及 限制 ， 让 我 们 下 一 节 继 续 探 讨 。 


8.3 细 世 和 局 限 性 


本 贡 介 绍 泛 型 中 的 一 些 细节 和 局 限 性 ， 这 些 局 限 性 主要 与 Java 的 
实现 机 制 有 关 。Java 中 ， 泛 型 是 通过 类 型 探 除 来 实现 的 ， 类 型 参数 在 
编译 时 会 被 蔡 换 为 Object， 运 行 时 Java 虚 拟 机 不 知道 沁 型 这 回 事 ， 这 种 
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常 的 。 


一 项 技术 ， 往 往 只 有 理解 了 其 局 限 性 ， 才 算是 真正 理解 了 它 ， 才 
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8.3.1 使 用 泛 型 类 、 方 法 和 接口 


在 使 用 泛 型 类 、 方 法 和 接口 时 ， 有 一 些 值得 注意 的 地 方 ， 比 如 : 
-基本 类 型 不 能 用 于 实例 化 类 型 参数 。 


:类 型 探 除 可 能 会 引发 一 些 冲 突 。 

我 们 逐个 来 看 下 。Java 中 ， 因 为 类 型 参数 会 被 狗 换 为 Object， 所 以 
人 
合法 的 : 


Pair<int> minmax = new Pair<int>(1,100); 


解决 方法 是 使 用 基本 类 型 对 应 的 包装 类 。 


在 介绍 继承 的 实现 原理 时 ， 我 们 提 到 在 内 存 中 每 个 类 都 有 一 份 类 
轧 ， 而 每 个 对 象 也 都 保存 着 其 对 应 类 型 信息 的 引用 。 关 于 运行 时 
， 后 续 章 节 我 们 会 进一步 详细 介绍 ， 这 里 简要 说 明 一 下 。 在 Java 
， 这 个 类 型 信息 也 是 一 个 对 象 ， 它 的 类 型 为 Class，Class 本 号 也 是 一 
个 泛 型 类 ， 每 个 类 的 类 型 对 象 可 以 通过 < 类 名 >.class 的 方式 引用 ， 比 如 
String.class、Integerclass。 这 个 类 型 对 象 也 可 以 通过 对 象 的 getClass 

() 方法 获得 ， 比 如 : 


加 


甘 吉 上 
2 zp 


Class<?> cls = "hello".getClass(); 


,这 个 类 型 对 象 只 有 一 份 ， 与 江 开 无关， 所 以 Java 不 支持 关 似 如 下 
写法 : 


Pair<Integer>.class 


一 个 泛 型 对 象 的 getClass 方 法 的 返回 值 与 原始 类 型 对 象 也 是 相同 
的 ， 比 如 ， 下 面 代码 的 输出 都 是 true: 


Pair<Integer> p1 = new Pair<Integer>(1,100); 
Pair<String> p2 = new Pair<String>("hello", "world"); 
System.out.println(Pair.class==p1i.getClass()); //true 
System.out.println(Pair.class==p2.getClass()); //true 


之 前 ， 我 们 介绍 过 instanceof 关 键 字 ，instanceof 后 面 是 接口 或 类 
名 ，instanceof 是 运行 时 判断 ， 也 与 泛 型 无 关 ， 所 以 ，Java 也 不 支持 类 
似 如 下 写法 : 
If(p1 instanceof Pair<Integer>) 


不 过 ，Java 支 持 如 下 写法 : 


if(p1i instanceof Pair<?>) 


由 于 类 型 擦 除 ， 可 能 会 引发 一 些 编译 冲突 ， 这 些 冲突 初 看 上 去 并 
不 容易 理解 ， 我 们 通过 一 些 例子 介绍 。8.2.3 市 我 们 介绍 过 一 个 例子 ， 


有 两 个 类 Base 和 Child，Base 的 声明 为 : 


class Base implements Comparable<Base> 


Child 的 声明 为 : 


class Child extends Base 


Child 没 有 专门 实现 Comparable 接 口 ，8.2.3 节 我 们 说 Base 类 已 经 有 
了 比较 所 需 的 全 部 信息 ， 所 以 Child 没 有 必要 实现 ， 可 是 如 果 Child 希 望 
目 定义 这 个 比较 方法 呢 ? 直觉 上 ， 可 以 这 样 修 改 Child 类 : 


Class Child extends Base Implements Comparable<Child>{ 


// 主 体 代码 
} 


遗憾 的 是 ，Java 编 译 右 会 提示 错误 ，Comparable 接 口 不 能 被 实现 
两 次 ， 且 两 次 实现 的 类 型 参数 还 不 同 ， 一 次 是 Comparable<Base> ， 一 
次 是 Comparable<Child>。 为 什么 不 允许 呢 ? 因为 类 型 探 除 后 ， 实 际 上 
口 台 大 一 个 
只 能 有 人 


那 Child 有 什么 办 法 修改 比较 方法 呢 ? 只 能 是 重 写 Base 类 的 实现 ， 
如 下 所 示 : 


Class Child extends Base { 
Qoverride 
public int compareTo(Base 0) { 
if(!(o instanceof Child)){ 
throw new IllegalArgumentException(); 


} 
child c = (child)o; 


// 比 较 代码 
return 0; 
} 
// 其 他 代码 


另外 ， 你 可 能 认为 可 以 如 下 定义 重 载 方法 : 


public static void test(DynamicArray<Integer> intArr) 
public static void test(DynamicArray<String> strArr) 


虽然 参数 部 是 DynamicArray， 但 实例 化 类 型 不 同 ， 一 个 是 
DynamicArray<Integer>， 另 一 个 是 DynamicArray<String>， 同样 遗憾 
Java 不 允许 这 种 写法 ， 理 由 同样 是 类 型 控 除 后 它们 的 声明 是 一 
8.3.2 ”定义 泛 型 类 、 方 法 和 接口 
5 在 定义 沁 型 类 、 方 法 和 接口 时 ， 也 有 一 些 需 要 注意 的 地 方 ， 比 
0D: 

:不 能 通过 类 型 参数 创建 对 象 。 

-这 型 类 类 型 参数 不 能 用 于 静态 变量 和 方法 。 

:了解 多 个 类 型 限定 的 语法 。 


我 们 逐个 介绍 。 不 能 通过 类 型 参数 创建 对 象 ， 比 如 ，T 是 类 型 参 
数 ， 下 面 的 写法 部 是 非法 的 : 


T elm = new T(); 
T[] arr = new T[10]; 


为 什么 非法 呢 ? 因 为 如 末 人 允许 ， 那 么 用 户 会 以 为 创建 的 就 十 对 应 
类 型 的 对 象 ， 但 由 于 类 型 擦 除 ，Java 只 能 创建 Object 类 型 的 对 象 ， 而 无 
法 创建 T 类 型 的 对 象 ， 容 易 引 起 误解 ， 所 以 Java 和 干脆 禁 止 这 么 做 。 


那 如 果 确 实 希 望 根据 类 型 创建 对 象 呢 ? 需要 设计 API 接 受 
象 ， 即 Class 对 象 ， 并 使 用 Java 中 的 反射 机 制 。 第 21 间 会 介绍 反射 ， 
里 简要 说 明 一 下 。 如 果 类 型 有 默认 构造 方法 ， 可 以 调用 Class 的 
newInstance 方 法 构建 对 象 ， 类 似 这 样 : 


public static <T> T create(Class<T> type){ 
try { 
return type.newInstance( ); 
} catch (Exception e) { 


return null; 


比如 : 


Date date = create(Date.class); 
StringBuilder sb = create(StringBuilder.class); 


对 于 泛 型 类 声明 的 类 型 参数 ， 可 以 在 实例 变量 和 方法 中 使 用 ， 但 
> 


public class Singleton<T> { 
private static T instance; 
public synchronized static T getInstance(){ 
if(instance==null1){ 
// 创 建 实例 


return instance; 
} 
} 


如 果 合 法 ， 那 么 对 于 每 种 实例 化 类 型 ， 都 需要 有 一 个 对 应 的 静态 
变量 和 方法 。 但 由 于 类 型 擦 除 ，Singleton 类 型 只 有 一 份 ， 静 态 变 量 和 
0 
参 有 效 。 


”不 过 ， 对 于 静态 万 法 ， 它 可 以 是 汉 型 方法 ， 可 以 声明 目 己 的 类 型 
参数 ， 这 个 参数 与 泛 型 类 的 类 型 参数 是 没有 关系 的 。 


之 前 介绍 类 型 参数 限定 的 时 候 ， 我 们 提 到 上 界 可 以 为 某 个 类 、 茶 
个 接口 或 者 其 他 类 型 参数 ， 但 上 界 都 是 只 有 一 个 ，Java 中 还 文 持 多 个 
上 界 ， 多 个 上 界 之 间 以 & 分 隔 ， 类 似 这 样 : 


T extends Base & Comparable & Serializable 


Base 为 上 界 类 ，Comparable 和 Serializable 为 上 界 接口 。 如 果 有 上 
界 类 ， 类 应 该 放 在 第 一 个 ， 类 型 控 除 时 ， 会 用 第 一 个 上 界 替 换 。 


8.3.3” 泛 型 与 数组 


泛 型 与 数组 的 关系 稍微 复杂 一 些 ， 我 们 单独 介绍 。 


引入 泛 型 后 ， 一 个 令 人 惊讶 的 事实 是 ， 不 能 创建 沁 型 数组 。 比 
如 ， 我 们 可 能 想 这 样 创 建 一 个 Pair 的 泛 型 数组 ， 以 表示 7.6 节 中 介绍 的 
交 励 面额 和 权重 。 


Pair<Object,Integer>[] options = new Pair<Object,Integer>[]{ 
new Pair("1 元 ",7)，new Pair("2 元 "，2)，mnew Pair("10 元 "，1) 
}; 


Java 会 提示 编译 错误 ， 不 能 创建 泛 型 数组 。 这 和 是 为 什么 呢 ? 我 们 
先 来 进一步 理解 一 下 数组 。 


前 面 我 们 解释 过 ， 类 型 参数 之 间 有 继承 关系 的 容 絮 之 间 是 没有 关 
系 的 ， 比 如 ， 一 个 DynamicArray<Integer> 对 象 不 能 赋值 给 一 个 
DynamicArray<Number> 变 量 。 不 过 ， 数 组 是 可 以 的 ， 看 代码 : 


Integer[] ints = new Integer[10]; 
Number[] numbers = ints,; 
Object[] objs = ints; 


后 面 两 种 赋值 都 是 允许 的 。 数 组 为 什么 可 以 呢 ? 数组 是 Java 直 接 
支持 的 概念 ， 它 知道 数组 元 素 的 实际 类 型 ， 知 道 Object 和 Number 都 是 
Integer 的 父 类 型 ， 所 以 这 个 操作 是 允许 的 。 


nn 但 如 采 使 用 不 当 ， 可 能 会 引起 运行 时 异 
第 ， 比 如 : 


Integer[] ints = new Integer[10]; 
Object[] objs = ints; 
objs[0] = "hello",; 


编译 是 没有 问题 的 ， 运 行 时 会 抛 出 ArrayStoreException， 因 为 Java 
知道 实际 的 类 型 是 mteger， 所 以 写 入 String 会 抛 出 异常 。 


理解 了 数组 的 这 个 行为 ， 我 们 再 来 看 泛 型 数组 。 如 果 Java 人 允许 创 
建 放 型 数组 ， 则 会 发 生 非 常 产 重 的 问题 ， 我 们 看 看 具体 会 发 生 什 么 : 


Pair<object, Integer>[] options = new Pair<Object,Integer>[3]; 
Object[] objs = options 
objs[0] = new Pair<Double,String>(12.34,"hello"); 


如 果 可 以 创建 泛 型 数组 options， 那 它 就 可 以 赋值 给 其 他 类 型 的 数 
组 objs， 而 最 后 一 行 明 显 错误 的 赋值 操作 ， 则 既 不 会 引起 编译 错误 ， 
也 不 会 触发 运行 时 异常 ， 因 为 Pair<Double，String> 的 运行 时 类 型 是 
Pair， 和 objs 的 运行 时 类 型 Pair[] 是 匹配 的 。 但 我 们 知道 ， 它 的 实际 类 
型 是 不 匹配 的 ， 在 程序 的 其 他 地 方 ， 当 把 objs[0] 作 为 Pair<Object， 
Integer> 进 行 处 理 的 时 候 ， 一 定 会 触发 异常 。 


也 就 是 说 ， 如 果 人 允许 创建 沁 型 数组 ， 那 就 可 能 会 有 上 面 这 种 错误 
操作 ， 它 既 不 会 引起 编译 错误 ， 也 不 会 立即 触发 运行 时 异常 ， 却 相当 
于 埋 下 了 一 颗 炸 弹 ， 不 定 什 么 时 候 爆 发 ， 为 避免 这 种 情况 ，Java 干 脆 
就 禁止 创建 泛 型 数组 。 


但 现实 需要 能 够 存放 泛 型 对 象 的 容器 ， 怎 么 办 呢 ? 可 以 使 用 原始 
类 型 的 数组 ， 比 如 : 


Pair[] options = new Pair[]t{ 
new Pair<String,Integer>("1 元 ",7), 
new Pair<String,Integer>("2 元 "，2)， 
new Pair<String,Integer>("10 元 "，1)}， 


更 好 的 选择 是 ， 使 用 后 续 章 地 介绍 的 泛 型 容 右 。 目 前 ， 可 以 使 用 
我 们 自己 实现 的 Dy-namicArray， 比 如 : 


DynamicArray<Pair<String,Integer>> options = new DynamicArray<>(); 
options.add(new Pair<String,Integer>("1 元 ",7)); 
options.add(new Pair<String,Integer>("2 元 ",2)); 
options.add(new Pair<String,Integer>("10 元 "1) )， 


DynamicArray 内 部 的 数组 为 Object 类 型 ， 一 些 操作 揪 入 了 强制 类 
型 转换 ， 外 部 接口 是 类 型 安全 的 ， 对 数组 的 访问 都 是 内 部 代码 ， 可 以 
避免 误 用 和 类 型 异常 。 


有 时 ， 我 们 布 望 斩 换 论 弄 容器 分 一 个 数组 ， 比 如 ， 对 于 
DynamicArray， 我 们 可 能 希望 它 有 这 文 色 一 个 及 全: 


public E[] toArray() 


而 希望 可 以 这 么 用 : 


DynamicArray<Integer> ints = new DynamicArray<Integer>(); 
ints.add(100); 

ints.add(34); 

Integer[] arr = ints.toArray(); 


先 使 用 动态 容器 收集 一 些 数据 ， 然 后 转换 为 一 个 固定 数组 ， 这 也 
ee 的 合理 需求 ， 怎 么 来 实现 0 可 能 想 先 这 


E[] arr = new E[sizel]; 


遗憾 的 是 ， 如 之 前 所 述 ， 这 是 不 合法 的 。Java 运 行 时 根本 不 知道 E 
古 什 么 ， 也 就 无 法 做 到 创建 E 类 型 的 数组 。 男 一 种 想法 是 这 样 : 


public E[] toArray(){ 
Object[] copy = new Object[sizel]; 
System.arraycopy(elementData, 0, copy, 0, size); 
return (E[])copy; 

} 


或 者 使 用 之 前 介绍 的 Arrays 方 法 : 


public E[] toArray(){ 
return (E[])Arrays.copyof (elementData, size); 


结果 都 是 一 样 的 ， 没 有 编译 错误 了， 但 运行 时 会 抛 出 
ClassCastException 异 常 ， 原 因 是 Object 类 型 的 数组 不 能 转换 为 Integer 类 
型 的 数组 。 


那 怎么 办 呢 ? 可 以 利用 Java 中 的 运行 时 类 型 信息 和 反映 机 制 ， 这 
些 概念 我 们 后 续 章 节 再 详细 介绍 。 这 里 我 们 简要 介绍 下 。Java 必 须 在 
类 型 可 以 作为 参数 传递 给 toArray 方 
法 ， 比 如 : 


public E[] toArray(Class<E> type){ 
Object copy = Array.newInstance(type, size); 
System.arraycopy(elementData, 0, copy, 90, size); 
return (E[])copy; 

} 


Class<E> 表 示 要 转换 成 的 数组 类 型 信息 ， 有 了 这 个 类 型 信息 ， 
Array 类 的 newInstance 方 法 就 可 以 创建 出 真正 类 型 的 数组 对 象 。 调 用 
toArray 方 法 时 ， 需 要 传递 需要 的 类 型 ， 比 如 ， 可 以 这 样 : 


Integer[] arr = ints,toArray(Integer ,Class ) 


我 们 来 稍微 总 结 下 泛 型 与 数组 的 关系 : 
Java 不 支持 创建 沁 型 数组 。 
-如果 要 存放 泛 型 对 象 ， 可 以 使 用 原始 类 型 的 数组 ， 或 者 使 用 沁 型 


中 。 
泛 型 容器 内 部 使 用 Object 数组 ， 如 果 要 转换 泛 型 容 需 为 对 应 类 型 
的 数组 ， 需 要 使 用 反射 。 
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本 市 介绍 了 泛 型 的 一 些 细 市 和 局 限 性 ， 这 些 局 限 性 主要 是 由 于 
Java 沁 型 的 实现 机 制 引 起 的 ， 这 些 局 限 性 包括 : 不 能 使 用 基本 类 型 ， 
没有 运行 时 类 型 信息 ， 类 型 擦 除 会 引发 一 些 冲 突 ， 不 能 通过 类 型 参数 
创建 对 象 ， 不 能 用 于 静态 变量 等 。 我 们 还 单独 讨论 了 泛 型 与 数组 的 关 
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我 们 需要 理解 这 些 局 限 性 ， 幸 运 的 是 ， 一 般 并 不 需要 特别 去 记 
忆 ， 因 为 用 错 的 时 候 ，Java 开 发 环境 和 编译 如 会 进行 提示 ， 当 说 提示 


时 能 够 理解 并 从 容 应 对 即 可 。 


至 此 ， 关 于 泛 型 的 介绍 就 结束 了 。 泛 型 是 Java 容 器 类 的 基础 ， 理 
解 了 泛 型 ， 接 下 来 ， 就 让 我 们 开始 探索 Java 中 的 容器 类 。 


第 9 章 ”列表 和 队列 


从 本 章 开始 ， 我 们 探讨 Java 中 的 容 吉 类 。 所 谓 容 项 ， 顾 名 思 义 束 
年 容纳 其 他 数据 的 。 计 算 机 课程 中 有 一 门 课 叫 数据 结构 ， 可 以 粗略 对 
应 于 Java 中 的 容器 类 。 容 器 类 可 以 说 是 日 常 程 序 开发 中 天 天 用 到 的 ， 
没有 容 右 类 ， 难 以 想象 能 开发 什么 真正 有 用 的 程序 。 


我 们 不 会 介绍 所 有 数据 结构 的 内 容 ， 但 会 介绍 Java 中 的 主要 实 
现 。 在 本 章 中 ， 我 们 移 介 绍 关 于 列表 和 队列 的 一 些 主要 类 ， 有 具体 包括 
ArrayList、LinkedList 以 及 ArrayDeque， 我 们 会 介绍 它们 的 用 法 、 背 后 
的 实现 原理 、 数 据 结构 和 算法 ， 以 及 应 用 场景 等 。 


9.1 剖析 ArrayList 


第 8 对 介绍 泛 型 的 时 候 ， 我 们 自己 实现 了 一 个 简单 的 动态 数组 容 右 
类 DynaArray， 本 六 将 介绍 Java 中 真正 的 动态 数组 容 絮 类 ArrayList。 本 
广 会 介绍 它 的 基本 用 法 、 送 代 操 作 、 实 现 的 一 些 接 口 (Collection、 
List 和 RandAccess) ， 最 后 分 析 它 的 特点 。 


9.1.1 基本 用 法 


ArrayList 是 一 个 泛 型 容 句 ， 新 建 ArrayList 需 要 实例 化 泛 型 参数 ， 
比如 : 


ArrayList<Integer> intList = new ArrayList<Integer>(); 
ArrayList<String> strList = new ArrayList<String>(); 


ArrayList 的 主要 方法 有 : 


public boolean add(E e) // 添 加 元 素 到 末 
public boolean isEmpty() // 判 断 是 否 为 空 
public int size() // 获 取 长 度 
public E get(int index) // 访 问 指 定位 置 的 元 素 

public int indexof(0bject 0) // 查 找 元 素 ， 如 果 找 到 ， 返 回 索 引 位 置 ， 否 则 返回 -1 
public int lastIndex0of(0bject o) // 从 后 往 前 找 
public boolean contains(0bject 0) // 是 否 包 含 指定 元 素 , 依据 是 equals 方 法 的 返回 值 
public E remove(int index) // 删 除 指定 位 置 的 元 素 ， 返 回 值 为 被 删 对 象 

// 删 除 指定 对 象 ， 只 删除 第 一 个 相同 的 对 象 ， 返 回 值 表示 是 否 删除 了 元 素 

// 如 果 o 为 nul1， 则 删除 值 为 nulL1 的 元 素 

public boolean remove(Object 0) 

public void clear() // 删 除 所 有 元 素 

// 在 指定 位 置 插入 元 素 ，index 为 6 表示 插入 最 前 面 ，index 为 ArrayList 的 长 度 表 示 揪 到 最 后 面 
public void add(int index, E element) 
public E set(int index，E element) // 修 改 指定 位 置 的 元 素 内 容 
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这 些 方法 简单 直接 ， 束 不 多 解释 了 ， 我 们 看 个 简单 示例 : 


ArrayList<String> strList = new ArrayList<String>(); 

strList.add(" 老 马 " ) ; 

strList.add(" 编 程 " )， 

for(int i=0; i<strList,.size(); i++){ 
System.out.printjn(strList.get(i)); 

} 


9.1.2 基本 原理 


可 以 看 出 ，ArrayList 的 基本 用 法 是 比较 简单 的 ， 它 的 基本 原理 也 
是 比较 简单 的 。Array-List 的 基本 原理 与 我 们 在 上 一 章 介 绍 的 
DynaArray 类 似 ， 内 部 有 一 个 数组 elementData， 一 般 会 有 一 些 预 留 的 
空间 ， 有 一 个 整数 size 记 录 实 际 的 元 素 个 数 (基于 Java 7) ， 如 下 所 
个 \: 


private transient Object[] elementData; 
private int size; 


我 们 暂时 可 以 忽略 transient 这 个 关键 字 。 各 种 public 方 法 内 部 操作 
的 基本 都 是 这 个 数组 和 这 个 整数 ，elementData 会 随 着 实际 元 素 个 数 的 
增多 而 重新 分 配 ， 而 size 则 始终 记录 实际 的 元 素 个 数 。 


a a 我 们 具体 来 看 下 add 和 remove 方 法 的 实现 。add 方 法 的 主要 
人 码 为 : 


public boolean add(E e) { 
ensureCapacityInternal(size + 1); 
elementData[size++] = e; 
return true; 


} 


它 首 和 完 调用 ensureCapacityInternal 确 保 数 组 容量 是 够 的 ， 
ensureCapacityInternal 的 代码 是 : 


private void ensureCapacityInternal(int minCapacity) { 
if(elementData == EMPTY_ELEMENTDATA) { 
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity); 


ensureExplicitCapacity(minCapacity); 


} 


它 先 判断 数组 是 不 是 空 的 ， 如 果 是 空 的 ， 则 首次 至 少 要 分 配 的 大 
小 为 DEFAULT_CAPACITY，DEFAULT CAPACITY 的 值 为 10， 接 下 
来 调用 ensureExplicitCapacity， 主 要 代码 为 : 


private void ensureExplicitCapacity(int minCapacity) { 


modCount++， 
if(minCapacity - elementData.1length > 0) 
grow(minCapacity ) ， 


modCount++ 是 什么 意思 呢 ? modCount 表 示 内 部 的 修改 次 数 ， 
modCount++ 当 然 就 是 增加 修改 次 数 ， 为 什么 要 记录 修改 次 数 呢 ?我 们 
待 会 解释 。 
会 解释 


代 Eh 需要 的 长 度 大 于 当前 数组 的 长 度 ， 则 调用 grow 方 法 ， 其 主要 
公 为 : 


private void grow(int minCapacity) { 
int oldCapacity = = elementData.length; 
// 右 移 一 位 相当 于 除 2， 所 以 ，newCcapacity 相 当 于 oldcapacity 的 1.5 倍 
int newCapacity = oldCapacity + (oldCapacity >> 1);，; 
// 如 果 扩 展 1.5 倍 还 是 小 于 mincapacity， 就 扩展 为 ninCcapacity 
if(newCapacity - minCapacity < 0) 
newCapacity = minCapacity; 
elementData = Arrays.copyof(elementData, newCapacity); 


代码 中 已 三 注释 说 明 ， 不 再 资 述 。 我 们 再 来 看 remove 方 法 的 代 


public E remove(int index) { 

rangeCheck(index); 

modCount++， 

E oldValue = elementData(index); 

int numMoved = size - index - 1; // 计 算 要 移动 的 元 素 个 数 

if(numMoved > 0) 
System.arraycopy(elementData, index+1, elementData, index, numMoved); 

elementData[--size] = null; // 将 size 减 1， 同 时 释放 引用 以 便 原 对 象 被 垃圾 回收 

return oldValue; 


它 也 增加 了 modCount， 然 后 计算 要 移动 的 元 素 个 数 ， 从 index 往 后 
的 元 素 都 往 前 移动 一 位 ， 实 际 调用 System.arraycopy 方 法 移动 元 素 。 
elementData[--size]=null;， 这 行 代码 将 size 减 1， 同 时 将 最 后 一 个 位 置 设 
为 null， 设 为 null 后 不 再 引用 原来 对 象 ， 如 果 原 来 对 象 也 不 再 被 其 他 对 
象 引 用 ， 束 可 以 被 垃圾 回收 。 


其 他 方法 大 多 是 比 较 简 单 的， 我 们 惑 不 资 坟 了。 上面 的 代码 中 ， 
为 便于 理解 ， 我 们 删 减 了 一 些 边 界 情 况 处 理 的 代码 ， 完 整 代码 要 星 深 
复杂 一 些 ， 但 接口 一 般 都 是 简单 直接 的 ， 这 就 是 使 用 容 右 类 的 好 处 ， 
这 也 是 计算 机 程序 中 的 基本 思维 方式 ， 封 闭 复 杂 操 作 ， 提 供 简化 接 
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9.1.3 ”和 友 代 


理解 了 ArrayList 的 基本 用 法 和 原理 ， 接 下 来 ， 我 们 来 看 一 个 
ArrayList 的 常见 操作 ， 和 迭代 。 我 们 看 一 个 迭代 操作 的 例子 ， 循 环 打印 
ArrayList 中 的 每 个 元 素 ，ArrayList 文 持 foreach 语 法 : 


ArrayList<Integer> intList = new ArrayList<Integer>(); 
intList.add(123); 
intList.add(456); 
intList.add(789); 
for(Integer a : intList){ 
System.out.println(a); 
} 


当然 ， 这 种 循环 也 可 以 使 用 如 下 代码 实现 : 


for(int i=0; i<intList.size(); i++){ 
System.out.println(intList.get(i)); 
} 


i 不 过 ，foreach 看 上 去 更 为 人 简洁， 而 且 它 适用 于 各 种 容 右 ， 更 为 通 


这 种 foreach 语 法 背后 是 怎么 实现 的 呢 ? 其 实 ， 编 译 姨 会 将 它 转换 
为 类 似 如 下 代码 : 


Iterator<Integer> it = intList.iterator(); 

while(it.hasNext()){ 
System.out.println(it.next()); 

} 


接 下 来 ， 我 们 解释 其 中 的 代码 。 


1. 迭 代 妖 接口 


ArrayList 实 现 了 Iterable 接 口 ，Iterable 表 示 可 迭代，Java 7 中 的 定义 
为 : 


public interface Iterable<T> { 
Iterator<T> iterator(); 
} 


定义 很 简单 ， 束 是 要 求实 现 iterator 方 法 。iterator 方 法 的 声明 为 : 
public Iterator<E> iterator() 


它 返 回 一 个 实现 了 Iterator 接 口 的 对 象 ，Java 7 中 Iterator 接 口 的 定义 
了 


public interface Iterator<E> { 
boolean hasNext() ， 
E_next() 
void remove( ) ， 


} 


hasNext () 判断 是 否 还 有 元 素 未 访问 ，next () 返回 下 一 个 元 
素 ，remove () 删除 最 后 返回 的 元 素 ， 只 读 访问 的 基本 模式 类 似 于 : 


Iterator<Integer> it = intList.iterator(); 

while(it.hasNext()){ 
System.out.println(it.next()); 

} 


我 们 待 会 再 看 迭代 中 间 要 删除 元 到 的 情况 。 


只 要 对 象 实 现 了 Iterable 接 口 ， 就 可 以 使 用 foreach 语 法 ， 编 译 器 会 
转换 为 调用 Iterable 和 Iterator 接 口 的 方法 。 初 次 见 到 Iterable 和 Iterator， 
可 能 会 比较 容易 混 消 ， 我 们 再 澄清 一 下 : 


Iterable 表 示 对 象 可 以 被 迭代 ， 它 有 一 个 方法 iterator () ， 返 回 
Iterator 对 象 ， 实 际 通 过 Iterator 接 口 的 方法 进行 壳 历 ; 


-如果 对 和 象 实 现 了 Iterable， 就 可 以 使 用 foreach 语 法 ; 

:类 可 以 不 实现 Iterable， 也 可 以 创建 Iterator 对 和 象 。 

需要 了 解 的 是 ，Java 8 对 Iterable 添 加 了 默认 方法 forEach 和 
spliterator， 对 Iterator 增 加 了 默 认 方 法 forEachRemaining 和 remove， 具 
体 可 参见 API 文 档 ， 我 们 区 不 介绍 了 。 
2.ListIterator 

除了 iterator () ，ArrayList 还 提供 了 两 个 返回 Iterator 接 口 的 方 
1 


public ListIterator<E> listIterator() 
public ListIterator<E> listIterator(int index) 


ListIterator 扩 展 了 Iterator 接 口 ， 增 加 了 一 些 方法 ， 回 前 遍历 、 添 加 
元 素 、 修 改元 素 、 返 回 索 引 位 置 等 ， 添 加 的 方法 有 : 


public interface ListIterator<E> extends Iterator<E> { 
boolean haspPrevious( ) ， 
E previous(); 
int nextIndex(); 
int previousIindex( ); 
void set(E e); 
void add(E e); 


listIterator () 方法 返回 的 迭代 器 从 0 开始 ， 而 listIterator (int 
Ee Na 。 比如， 从 末尾 往 前 遍 
力 ， 代 公 为 : 


public void reverseTraverse(List<Integer> list){ 
ListIterator<Integer> it = list.]listIterator(list.size()); 
while(it.hasprevious())t 
System.out.println(it.previous()); 
} 


} 


3. 太 代 的 陷阱 


天 于 迭代 和 右 ， 有 一 种 逢 见 的 误 用 ， 束 是 在 欠 代 的 中 间 调 用 容 郁 的 
删除 方法 。 比 如 ， 要 删除 一 个 整数 ArrayList 中 所 有 小 于 100 的 数 ， 直 觉 
上 上， 代码 可 以 这 么 写 : 


public void remove(ArrayList<Integer> list){ 
for(Integer a : list){ 
if(a<=100)f{ 
list.remove(a); 
} 
} 
} 


但 运行 时 会 抛 出 异 第 : 


java.util.ConcurrentModificationException 


发 生 了 并 发 修改 异常 ， 为 什么 呢 ? 因 为 迭代 器 内 部 会 维护 一 些 索 
引 位 置 相 关 的 数据 ， 要 求 在 迭代 过 程 中 ， 容 器 不 能 发 生 结 构 性 变化 ， 
否则 这 些 索引 位 置 惑 失效 了 。 所 谓 结构 性 变化 就 是 添加 、 插 入 和 删除 
元 素 ， 只 十 修 改元 素 内 容 不 算 结构 性 变化 。 


如 何 避 免 异 党 呢 ? 可 以 使 用 适 代 天 的 remove 方 法 ， 如 下 所 示 : 


public static void remove(ArrayList<Integer> 1ist){ 
Iterator<Integer> it = list.iterator(); 
while(it.hasNext()){ 
if(it.next()<=100){ 
it.removel( ); 
} 


} 
} 


迭代 如 如 何 知道 发 生 了 结构 性 变化 ， 并 抛 出 异常 ? 它 目 己 的 
remove 方 法 为 何 又 可 以 使 用 呢 ? 我 们 需要 看 下 迄 代 右 实 现 的 原理 。 


4. 友 代 器 实现 的 原理 
我 们 来 看 下 ArrayList 中 iterator 方 法 的 实现 ， 代 码 为 : 


public Iterator<E> iterator() { 
return new Itr(); 


狐 建 了 一 个 It 对象 ，It 是 一 个 成 员 内 部 类 ， 实 现 了 Iterator 接 口 ， 
声明 为 : 


private class Itr implements Iterator<E> 


它 有 三 个 实例 成 员 变 量 ， 为 : 


int cursor; // 下 一 个 要 返回 的 元 素 位 
int lastRet = -1; // 最 后 一 个 返回 的 索引 位 置 ， 如 果 没 有 ， 为 -1 
int expectedModCount = modCcount 


cursor 表 示 下 一 个 要 返回 的 元 素 位 置 ，lastRet 表 示 最 后 一 个 返回 的 
索引 位 置 ，expected-ModCount 表 示 期 望 的 修改 次 数 ， 初 始 化 为 外 部 类 
当前 的 修改 次 数 modCount， 回 顾 一 下 ， 成 员 内 部 类 可 以 直接 访问 外 部 
类 的 实例 变量 。 每 次 发 生 结 构 性 变化 的 时 候 modCount 都 会 增加 ， 而 每 
次 迭代 妖 操 作 的 时 候 都 会 检查 expectedModCount 是 否 与 modCount 相 
同 ， 这 样 就 能 检测 出 结构 性 变化 。 


我 们 来 具体 看 下 ， 它 是 如 何 实 现 Iterator 接 口中 的 每 个 方法 的 ， 先 
看 hasNext () ， 代 码 为 : 


public boolean hasNext() { 
return cursor != size,; 


cursor 与 size 比 较 ， 比 较 直 接 ， 看 next 方 法 : 


public E next() { 
checkForComodification(); 
int i = cursor,; 
if(i >= size) 
throw new NoSuchElementException(); 
Object[] elementData = ArrayList.this.elementData,; 
if(i >= elementData.1length) 
throw new ConcurrentModificationException(); 
cursor = 工 + 工 
return (E) elementData[lastRet = i]; 


首先 调用 了 checkForComodification， 它 的 代码 为 : 


final void checkForComodification() { 
if(modCount != expectedModCount) 
throw new ConcurrentModificationException(); 


所 以 ，next 前 面部 分 主要 就 是 在 检查 是 否 发 后 了 结构 性 变化 ， 如 
果 没 有 变化 ， 就 更 新 cursor 和 1lastRet 的 值 ， 以 保持 其 语义 ， 然 后 返回 对 
应 的 元 素 。remove 的 代码 为 : 


public void remove() { 
if(lastRet < 0) 
throw new IllegalSstateException(); 
checkForComodification(); 
try { 
ArrayList.this.remove(lastRet); 
cursor = lastRet,; 
lastRet = -1; 
expectedModCount = modCount; 
} catch (IndexOutofBoundsException ex) { 
throw new ConcurrentModificationException(); 
} 


} 


它 调用 了 ArrayList 的 remove 方 法 ， 但 同时 更 新 了 cursor、lastRet 和 
expectedModCount 的 值 ， 所 以 它 可 以 正确 删除 。 不 过 ， 需 要 注意 的 
是 ， 调 用 remove 方 法 前 必须 先 调 用 next， 比 如 ， 通 过 送 代 器 删 除 所 有 
元 率直 而 上 可 以 这 人 与 


public static void removeAll(ArrayList<Integer> list){ 
Iterator<Integer> it = list.iterator(); 
while(it.hasNext()){ 
it.removel( ); 


ww 


实际 运行 ， 
是 : 


办 


抛 出 异常 java.lang.IllegalStateException， 正 确 写 法 


public static void removeAll(ArrayList<Integer> list){ 
Iterator<Integer> it = list.iterator(); 


while(it.hasNext()){ 
it.next(); 
It,remove( ); 
} 
} 


当然 ， 如 果 只 是 要 删除 所 有 元 素 ，ArrayList 有 现成 的 方法 clear 


listIterator () 的 实现 使 用 了 另 一 个 内 部 类 Listftr， 它 继承 自 Itr， 
基本 思路 类 似 ， 我 们 就 不 警 述 了 。 


5. 迭 代 雁 的 好 处 


为 什么 要 通过 迭代 器 这 种 方式 访问 元 素 呢 ? 直接 使 用 size () /get 
(index) 语法 不 也 可 以 吗 ? 在 一 些 场景 下 ， 确 实 没 有 什么 差别 ， 两 者 
都 可 以 。 不 过 ，foreach 语 法 更 为 简洁 一 些 ， 更 重要 的 是 ， 迭 代 硕 语法 
更 为 通用 ， 它 适用 于 各 种 容 右 类 。 


此 外 ， 和 迭代 器 表示 的 是 一 种 关注 点 分 离 的 思想 ， 将 数据 的 实际 组 
织 方式 与 数据 的 友 代 遍历 相 分 离 ， 是 一 种 音 见 的 设计 模式 。 需要 访问 
容器 元 素 的 代码 只 需要 一 个 Iterator 接 口 的 引用 ， 不 需要 关注 数据 的 实 
际 组 织 方式 ， 可 以 使 用 一 致 和 统一 的 方式 进行 访问 。 


而 提供 Iterator 接 口 的 代码 了 解数 据 的 组 织 方 式 ， 可 以 提供 高 效 的 
实现 。 在 ArrayList 中 ，size/get (index) 语法 与 迭代 器 性 能 是 差不多 
的 ， 但 在 后 续 介 绍 的 其 他 容器 中 ， 则 不 一 定 ， 比 如 LinkedList， 和 迭代 器 
性 能 就 要 高 很 多 。 


从 封装 的 思路 上 讲 ， 送 代 器 封装 了 各 种 数据 组 织 方式 的 送 代 操 
作 ， 提 供 了 简单 和 一 致 的 接口 。 


9.1.4 ”ArrayList 实 现 的 接口 


Java 的 各 种 容 句 关 有 一 些 共 性 的 操作 ， 这 些 共 性 以 接口 的 方式 体 
现 ， 我 们 刚刚 介绍 的 Iterable 接 口 束 是 ， 此 外 ，ArrayList 还 实现 了 三 个 
主要 的 接口 : Collection、List 和 Random-Access， 我 们 逐个 介绍 。 


1.Collection 


Collection 表 示 一 个 数据 集合 ， 数 据 间 没 有 位 置 或 顺序 的 概念 ， 
Java 7 中 的 接口 定义 为 : 


public interface Collection<E> extends Iterable<E> { 
int size(); 
boolean isEmpty(); 
boolean contains(Object 0o); 
Iterator<E> iterator(); 
Object[] toArray(); 
<T> T[] toArray(T[] a); 
boolean add(E e); 
boolean remove(Object 0o); 
boolean containsAll(Collection<?> c); 
boolean addAll(Collection<? extends E> c); 
boolean removeAll(Collection<?> C)， 
boolean retainAll(Collection<?> C)， 
void clear(); 
boolean equals(Object 0o); 
int hashCode(); 


这 些 方法 中 ， 除 了 两 个 toArray 方 法 和 几 个 xxxAll () 方法 外 ， 其 
他 我 们 已 经 介绍 过 了 “。toArray 方 法 我 们 竺 会 再 介绍 。 这 几 个 xxxAll 
() 方法 的 含义 基本 也 是 可 以 顾名思义 的 ，addAll 表 示 添 加 ， 
removeAll 表 示 删 除 ，containsAll 表 示 检 查 是 否 包 仿 了 参数 容 强 中 的 所 
有 元 素 ， 只 有 全 包含 才 返 回 true，retainAll 表 示 只 保留 参数 容器 中 的 元 
素 ， 其 他 元 素 会 进行 删除 。Java 8 对 Collection 接 口 添 加 了 几 个 默认 方 
法 ， 包 括 removeIf、stream、spliterator 等 ， 具 体 可 参见 API 文 档 。 


抽象 类 AbstractCollection 对 这 几 个 方法 都 提供 了 默认 实现 ， 实 现 
人 。 比 如， 我 们 看 removeAll 方 法 ， 
人 码 为 : 


public boolean removeAll(Collection<?> c) { 
boolean modified = false; 
Iterator<?> it = iterator(); 
while(it.hasNext()) { 
if(c.contains(it.next())) { 
it.removel( ); 
modified = true; 


} 


return modified; 


代码 比较 简单 ， 就 不 解释 了 。ArrayList 继 承 了 AbstractList， 而 
AbstractList 又 继承 了 AbstractCollection，ArrayList 对 其 中 一 些 方法 进行 
了 重 写 ， 以 提供 更 为 高 效 的 实现 ， 具 体 不 再 介绍 。 


2.List 


List 表 示 有 顺序 或 位 置 的 数据 集合 ， 它 扩展 了 Collection， 增 加 的 
主要 方法 有 (Java7) : 


boolean addAll(int index, Collection<? extends E> c); 
E get(int index); 

E set(int index, E element); 

void add(int index, E element); 

E remove(int index); 

int indexof(Object 0); 

int lastIndexof(Object 0o); 

ListIterator<E> listIiterator(); 

LiSstIterator<E> listIterator(int index); 

List<E> SubList(int fromIndex, int toIndex); 


这 些 方 法 都 与 位 置 有 关 ， 容 易 理 解 ， 束 不 介绍 了 。Java 8 对 List 接 
口 增加 了 几 个 默认 方法 ， 包 括 sort、replaceAll 和 spliterator; Java 9 增加 
了 多 个 重 载 的 of 方法 ， 可 以 根据 一 个 或 多 个 元 素 生 成 一 个 不 变 的 List， 
具体 殉 不 介绍 了 ， 可 参看 API 文 档 。 


3.RandomAccess 


RandomAccess 的 定义 为 : 


public interface RandomAccess { 


没有 定义 任何 代码 。 这 有 什么 用 呢 ? 这 种 没有 任何 代码 的 接口 在 
Java 中 被 称 为 标记 接口 ， 用 于 声明 类 的 一 种 属性 。 


这 里 ， 实 现 了 RandomAccess 接 口 的 类 表示 可 以 随机 访问 ， 可 随机 
访问 就 是 具备 类 似 数 组 那样 的 特性 ， 数 据 在 内 存 是 连续 存放 的 ， 根 据 
索引 值 就 可 以 直接 定位 到 具体 的 元 素 ， 访 问 效 率 很 高 。 下 节 我 们 会 介 
绍 LinkedList， 它 就 不 能 随机 访问 。 


有 没有 声明 RandomAccess 有 什么 关系 呢 ? 主要 用 于 一 些 通 用 的 算 
法 代码 中 ， 它 可 以 根据 这 个 声明 而 选择 效率 更 高 的 实现 。 比 如 ， 
Collections 类 中 有 一 个 方法 binarySearch， 在 List 中 进行 二 分 查找 ， 它 的 
0 了 RandomAccess 而 采用 不 同 的 实现 机 制 ， 
中 不 : 


public static <T> 
int binarySearch(List<? extends Comparable<? super T>> list, T key) { 
if(list instanceof RandomAccess || list.size()<BINARYSEARCH_ THRESHOLD) 
return Collections.indexedBinarySearch(list, key); 
else 
return Collections.iteratorBinarySearch(list, key); 


9.1.5 ”ArrayList 的 其 他 方法 


ArrayList 中 还 有 一 些 其 他 方法 ， 包 括 构 造 方法 、 与 数组 的 相互 转 
换 、 容 量 大 小 控制 等 ， 我 们 来 看 下 。ArrayList 还 有 两 个 构造 方法 : 


public ArrayList(int initialCapacity) 
public ArrayList(Collection<? extends E> c) 


第 一 个 方法 以 指定 的 大 小 initialCapacity 初 始 化 内 部 的 数组 大 小 ， 
代码 为 : 


this.elementData = new Object[initialCapacity]， 


在 事先 知道 元 素 长 度 的 情况 下 ， 或 者 ， 预 先知 道 长 度 上 限 的 情况 
下 ， 使 用 这 个 构造 方法 可 以 避免 重新 分 配 和 复制 数组 。 第 二 个 构造 方 
法 以 一 个 已 有 的 Collection 构 建 ， 数 据 会 新 复制 一 份 。 


ArrayList 中 有 两 个 方法 可 以 返回 数组 : 


public Object[] toArray() 
public <T> T[] toArray(T[] a) 


第 一 个 方法 返回 是 Object 数组 ， 代 码 为 : 


public Object[] toArray() { 
return Arrays.copyof(elementData, size); 
} 


”第 二 个 方法 返回 对 应 类 型 的 数组 ， 如 果 参 数 数组 长 度 足以 容纳 所 
有 元 素 ， 就 使 用 该 数组 ， 否 则 就 新 建 一 个 数组 ， 比 如 : 


ArrayList<Integer> intList = new ArrayList<Integer>(); 
intList.add(123); 

intList.add(456); 

intList.add(789); 

Integer[] arrA = new Integer[3]; 
intList.toArray(arrA); 

Integer[] arrB = intList.toArray(new Integer[0]); 
System.out.println(Arrays.equals(arrA, arrB)); 


输出 为 tue， 表 示 两 种 方式 都 是 可 以 的 。 
Arrays 中 有 一 个 静态 方法 asList 可 以 返回 对 应 的 List， 如 下 所 示 : 


Integer[] a = {1,2,3}; 
List<Integer> list = Arrays.asList(a); 


需要 注意 的 是 ， 这 个 方法 返回 的 List， 它 的 实现 类 并 不 是 本 太 介 
绍 的 ArrayList， 而 是 Arrays 类 的 一 个 内 部 类 ， 在 这 个 内 部 类 的 实现 
中 ， 内 部 用 的 数组 就 是 传 入 的 数组 ， 没 有 揽 贝 ， 也 不 会 动态 改变 大 
小 ， 所 以 对 数组 的 修改 也 会 反映 到 List 中 ， 对 List 调 用 add、remove 方 
法 会 抛 出 异常 。 


要 使 用 ArrayList 完 整 的 方法 ， 应 该 新 建 一 个 ArrayList， 如 下 所 
和 小: 


List<Integer> list = new ArrayList<Integer>(Arrays.asList(a)); 


ArrayList 还 提供 了 两 个 public 方 法 ， 可 以 控制 内 部 使 用 的 数组 大 
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public void ensureCapacity(int minCapacity ) 


它 可 以 确保 数组 的 大 小 至 少 为 minCapacity， 如 果 不 够 ， 会 进行 扩 
展 。 如 采 已 经 预知 ArrayList 需 要 比较 大 的 容量 ， 调 用 这 个 方法 可 以 城 
少 ArrayList 内 部 分 配 和 扩展 的 次 数 。 


[三 
力 人 方 苇 十 : 
public void trimToSize() 


它 会 重新 分 配 一 个 数组 ， 大 小 刚好 为 实际 内 容 的 长 度 。 调 用 这 个 
方法 可 以 节省 数组 占用 的 空间 。 


9.1.6 ”ArrayList 特 点 分 析 


后 续 我 们 会 介绍 各 种 容 絮 类 和 数据 组 织 方式 。 之 所 以 有 各 种 不 同 
的 方式 ， 征 因为 不 同方 式 有 不 同 特点 ， 而 不 同 特 操 有 不 同 适 用 场合 。 
考虑 特点 时 ， 性 能 是 其 中 一 个 很 重要 的 部 分 ， 但 性 能 不 是 一 个 简单 的 
人 


作为 程序 员 ， 台 是 要 理解 每 种 数据 结构 的 特点 ， 根 据 场 合 的 不 
同 ， 选 择 不 同 的 数据 结构 。 


对 于 ArrayList， 它 的 特点 是 内 部 采用 动态 数组 实现 ， 这 决定 了 以 
下 几 点 。 


1) 可 以 随机 访问 ， 按 照 索引 位 置 进行 访问 效率 很 高 ， 用 算法 描述 
中 的 术语 ， 效 率 是 O (1) ， 简 单 说 就 是 可 以 一 步 到 位 。 

2) 除非 数组 已 排序 ， 否 则 按照 内 容 查找 元 素 效率 比较 低 ， 有 具体 是 
O(N) ，N 为 数组 内 容 长 度 ， 也 就 是 说 ， 性 能 与 数组 长 度 成 正比 。 


3) 添加 元 素 的 效率 还 可 以 ， 重 新 分 配 和 复制 数组 的 开销 被 乎 摊 
了 ， 有 具体 来 说 ， 添 加 N 个 元 素 的 效率 为 0 (N) 。 


。 插入 和 删除 元 素 的 效率 比较 低 ， 因 为 需要 移动 元 素 ， 具 体 为 9 
N Oo 


917 二 


本 下 详细 介绍 了 ArrayList，ArrayList 是 日 常 开 发 中 最 常用 的 类 之 
一 。 我 们 介绍 了 ArrayList 的 用 法 、 基 本 实现 原理 、 和 迭代 恬 及 其 实现 、 
Collection/List/RandomAccess 接 口 、ArrayList 与 数组 的 相互 转换 ， 最 后 
分 析 了 ArrayList 的 特点 。 


需要 说 明 的 是 ，ArrayList 不 是 线程 安全 的 ， 关 于 线程 我 们 在 第 15 
章 介 绍 ， 实 现 线程 安全 的 一 种 方式 是 使 用 Collections 提 供 的 方法 装 ? 
ArrayList， 这 个 我 们 会 在 12.2 节 人 介绍。 此外， 需要 了 解 的 是 ， 还 有 一 
个 类 Vector， 它 是 Java 最 早 实现 的 容 需 类 之 一 ， 也 实现 了 List 接 口 ， 基 
本 原理 与 ArrayList 类 似 ， 内 部 使 用 synchronized (15.2 廊 介绍) 实现 了 
线程 安全 ， 不 需要 线程 安全 的 情况 下 ， 推 荐 使 用 ArrayList 。 


ArrayList 的 插入 和 删除 的 性 能 比较 低 ， 下 一 下 ， 我 们 来 看 另 一 个 
同样 实现 了 List 接 口 的 容器 类 : LinkedList， 它 的 特点 可 以 说 与 
ArrayList 正 好 相反 。 


9.2 ” 襄 析 LinkedList 


ArrayList 随 机 访问 效率 很 高 ， 但 插入 和 删除 性 能 比较 低 ; 
LinkedList 同 样 实现 了 List 接 口 ， 它 的 特点 与 ArrayList 几 乎 正好 相反 ， 本 
志 我 们 束 来 详细 介 Zo ikedList o 


除了 实现 了 List 接 口外 ，LinkedList 还 实现 了 Deque 和 Queue 接 口 ， 
栈 和 双 端 队列 的 方式 进行 操作 。 本 蔬 会 介绍 这 些 用 
， 同 时 介绍 其 实现 原理 。 我 们 先 来 看 它 的 用 法 。 


9.2.1 用 法 


LinkedList 的 构造 方法 与 ArrayList 类 似 ， 有 两 个 : 一 个 是 默认 构造 
方法 ， 另 外 一 个 可 以 接受 一 个 已 有 的 Collection ， 和 如 址 所 示 


public LinkedList() 
public LinkedList(Collection<? extends E> c) 


比如 ， 可 以 这 么 创建 


List<String> list = new LinkedList<>(),; 
List<String> list2 = new LinkedList<>( 
Arrays.asList(new String[]{"a","b","c"})); 


LinkedList 与 ArrayList 一 样 ， 同 样 实现 了 List 接 口 ， 而 List 接 口 扩展 
下 Collection 接 口 ，Collection 又 扩展 了 Iterable 接 口 ， 所 有 这 些 接口 的 方 
去 都 是 可 以 使 用 的 ， 使 用 方法 与 上 贡 介 绍 的 一 样 ， 本 和 不 再 警 述 。 
LinkedList 还 实现 了 队列 接口 Queue， 所 请 队列 惑 类 似 于 日 第 生活 中 的 
各 种 排队 ， 特 点 了 驶 是 移 进 移出 ， 在 尾部 添加 元 素 ， 从 头 部 删除 元 素 ， 
它 的 接口 定义 为 : 


public interface Queue<E> extends Collection<E> { 
boolean add(E e); 
boolean offer(E e); 
E remove(); 
E poll(); 


E element( ) 
E peek(); 


Queue 扩 展 了 Collection， 它 的 主要 操作 有 三 个 : 
:在 尾部 添加 元 素 (add 、offer) ，; 
.查看 头 部 元 素 (element、peek) ， 返 回头 部 元 素 ， 但 不 改变 队 


.删除 头 部 元 素 (remove、poll) ， 返 回头 部 元 素 ， 并 且 从 队列 中 删 


每 种 操作 都 有 两 种 形式 ， 有 什么 区 别 呢 ?区 别 在 于 ， 对 于 特殊 情 
况 的 处 理 不 同 。 特 殊 情况 是 指 队 列 为 空 或 者 队列 为 满 ， 为 空 容易 理 
解 ， 为 满 是 指 队 列 有 长 度 大 小 限制 ， 而 且 已 经 占 满 了 。LinkedList 的 实 
现 中 ， 队 列 长 度 没 有 限制 ， 但 别 的 Queue 的 实现 可 能 有 。 在 队列 为 空 
时 ，element 和 remove 会 抛 出 异常 NoSuchElementException， 而 peek 和 
pol 返 回 特殊 值 null;， 在 队列 为 满 时 ，add 会 抛 出 异 第 
IlegalStateException， 而 offer 只 是 返回 false。 


把 LinkedList 当 作 Queue 使 用 也 很 简单 ， 比 如 ， 可 以 这 样 : 


Queue<String> queue = new LinkedList<>(); 

queue.offer("a"); 

queue.offer("b"); 

queue.offer("c"); 

while(queue.peek()!=null){ 
System.out.printlin(queue.poll()); 
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输出 有 三 行 ， 依 次 为 a、b 和 c。 


我 们 在 介绍 函数 调用 原理 的 时 候 介 绍 过 栈 。 栈 也 是 一 种 常用 的 数 
据 结 构 ， 与 队列 相反 ， 它 的 特点 是 先进 后 出 、 后 进 先 出 ， 类 似 于 一 个 
储 物 箱 ， 放 的 时 候 是 一 件 件 往 上 放 ， 拿 的 时 候 则 只 能 从 上 面 开始 拿 。 
Java 中 没有 单独 的 栈 接口 ， 栈 相关 方法 包括 在 了 表示 双 端 队列 的 接口 
Deque 中 ， 主 要 有 三 个 方法 : 


void push(E e); 
E pop(); 
E peek(); 


解释 如 下 。 


1) push 表 示 入 栈 ， 在 头 部 添加 元 素 ， 栈 的 空间 可 能 是 有 限 的 ， 如 
采 栈 满 了 ，push 会 抛 出 异 名 IllegalStateException 。 


2) pop 表 示 出 栈 ， 返回 头 部 元 素 ， 并 且 从 栈 中 删除 ， 如 果 栈 为 
空 ， 会 抛 出 异常 NoSuch-ElementException 。 


3) peek 查 看 栈 头 部 元 素 ， 不 修改 栈 ， 如 果 栈 为 空 ， 返 回 null。 
把 LinkedList 当 作 栈 使 用 也 很 简单 ， 比 如 ， 可 以 这 样 : 


Deque<String> Stack = new LinkedList<>(); 

stack.push("a"); 

stack.push("b"); 

stack.push("c"); 

while(stack.peek()!=null){ 
System.out.printin(stack.pop()); 

} 


输出 有 三 行 ， 依 次 为 c、b 和 a。 


Java 中 有 一 个 类 Stack， 单 词 意思 是 栈 ， 它 也 实现 了 栈 的 一 些 方 
法 ， 如 push/pop/peek 等 ， 但 它 没有 实现 Deque 接 口 ， 它 是 Vector 的 于 
类 ， 它 增加 的 这 些 方法 也 通过 synchronized 实 现 了 线程 安全 ， 有 具体 就 不 

介绍 了 。 不 需要 线程 安全 的 情况 下 ， 推 荐 使 用 LinkedList 或 下 节 介绍 的 
人 ?9 


栈 和 队列 都 是 在 两 端 进行 操作 ， 栈 只 操作 头 部 ， 队 列 两 端 都 操 
作 ， 但 尾部 只 添加 、 头 部 只 查看 和 删除 。 人 
。 Deque 扩 展 了 Queue， 包括 了 栈 的 操作 方法 ， 此 外 ， 它 还 
有 如 下 更 为 明确 的 操作 两 端的 方法 : 


void addFirst(E e); 

void addLast(E e); 

E getFirst()， 

E getLast(); 

boolean offerFirst(E e); 


boolean offerLast(E e); 
E peekFirst(); 

E peekLast(); 

E pollFirst(); 

E pollLast(); 

E removeFirst()， 

E removeLast(); 


xxxFirst 操 作 头 部 ，xxxLast 操 作 尾 部 。 与 队列 类 似 ， 每 种 操作 有 两 
种 形式 ， 区 别 也 是 在 队列 为 空 或 满 时 处 理 不 同 。 为 空 时 
getXXX/removeXXX 会 抛 出 异常 ， 而 peekXXX/pollXXX 会 返 回 nul。 队 
列 满 时 ，addXXX 会 抛 出 异常 ，offerXXX 只 是 返回 false。 


栈 和 队列 只 是 双 闪 队列 的 特殊 情况 ， 它 们 的 方法 都 可 以 使 用 双 端 
队列 的 方法 奉 代 ， 不 过 ， 使 用 不 同 的 名 称 和 方法 ， 概 念 上 更 为 清晰 。 


Deque 接 口 还 有 一 个 迭代 器 方法 ， 可 以 从 后 往 前 遍历 : 


Iterator<E> descendingIterator() 


比如 ， 看 如 下 代码 : 


Deque<String> deque = new LinkedList<>( 
Arrays.asList(new String[]{"a","b","c"})); 
Iterator<String> it = deque.descendingIterator(); 
while(it.hasNext()){ 
System.out.print(it.next()+" "); 


} 
输出 为 : 
cba 


简单 忌 结 下 : LinkedList 的 用 法 是 比较 简单 的 ， 与 ArrayList 用 法 类 
似 ， 支 持 List 授 口 ， 只 是 ，LinkedList 增 加 了 一 个 接口 Deque， 可 以 把 它 
看 作 队 列 、 栈 、 双 端 队 列 ， 方 便 地 在 两 端 进 行 操作 。 如 果 只 是 用 作 
List， 那 应 该 用 ArrayList 还 是 LinkedList 呢 ? 我 们 需要 了 解 LinkedList 的 
实现 原理 。 


9.2.2 ”实现 原理 


我 们 先 来 看 LinkedList 的 内 部 组 成 ， 然 后 分 析 它 的 一 些 主要 方法 的 
实现 ， 代 码 基于 Java 7。 


1. 内 部 组 成 


我 们 知道 ，ArrayList 内 部 是 数组 ， 元 素 在 内 存 是 连续 存放 的 ， 但 
LinkedList 不 是 。LinkedList 直 译 束 是 链表 ， 人 确切 地 说 ， 它 的 内 部 实现 是 
双 辣 链表 ， 每 个 元 素 在 内 存 都 是 单独 存放 的 ， 元 素 之 间 通 过 链接 连 在 
一 起 ， 类 似 于 小 朋友 之 间 手 拉手 一 样 。 


为 了 表示 链接 关系 ， 需 要 一 个 万 氮 的 概念 。 记 点 包括 实际 的 元 
素 ， 但 同时 有 两 个 链接 ， 分 别 指向 前 一 个 节点 (前 册 和 后 一 个 节点 
(后 继 ) 。 市 点 是 一 个 内 部 类 ， 具 体 定义 为 : 


private static class Node<E> { 
E item; 
Node<E> next; 
Node<E> prev; 
Node(Node<E> prev, E element, Node<E> next) { 
this.item = element; 
this.next = next,; 
this.prev = prev,; 
} 
} 


Node 类 表示 有 点 ，item 指 同 实 际 的 元 素 ，next 指 回 后 一 个 万 点 ， 
prev 指 癌 前 一 个 节点 


LinkedList 内 部 组 成 加 是 如 下 三 个 实例 变量 : 


transient int size = 0; 
transient Node<E> first; 
transient Node<E> last,; 


我 们 暂时 忽略 transient 关 键 字 ，size 表 示 链 表 长 度 ， 默 认为 0，first 
指 回 头 节 点 ，last 指 回 尾 节点 ， 初 始 值 都 为 null 。 


LinkedList 的 所 有 public 方 法 内 部 操作 的 都 是 这 三 个 实例 变量 ， 具 
体 是 怎么 操作 的 ? 链接 关系 是 如 何 维护 的 ? 我 们 看 一 些 主要 的 方法 ， 
先 来 看 add 方 法 。 


2.add 方 法 
add 方 法 的 代码 为 : 


public boolean add(E e) { 
linkLast(e); 
return true; 


} 


主要 就 是 调用 了 linkLast， 它 的 代码 为 : 


void linkLast(E e) { 
final Node<E> 1 = last; 
final Node<E> newNode = new Node<>(1, e, null); 
last = newNode; 
if(1 == null) 
first = newNode; 
else 
l1.next = newNode; 
Sizet+; 
modCount++; 


代码 的 基本 步 又 如 下 。 


1) 创建 一 个 新 的 节点 newNode。1 和 last 指 癌 原 来 的 尾 节 点 ， 如 果 
原来 链表 为 宝 ， 则 为 nul。 代 码 为 : 


Node<E> newNode = new Node<>(1, e, null); 
2) 修改 尾 节 点 last， 指 向 新 的 最 后 和 点 newNode。 代 码 为 : 


last = newNode; 


3) 修改 前 太后 的 后 癌 链 接 ， 如 末 原 来 链表 为 空 ， 则 让 类 市 点 指 问 
新 节点 ， 否 则 让 前 一 个 节点 的 next 指 向 新 节点 。 代 码 为 : 


if(1 == null) 

first = newNode 
else 

l1.next = newNode; 


4) 增加 链表 大 小 。 代 码 为 : 


SIZe++ 


modCount++ 的 目的 与 ArrayList 是 一 样 的 ， 记 隶 修 改 次 数 ， 便 于 送 
代 中 间 检 测 结构 性 变化 。 


我 们 通过 一 些 图 示 来 进行 介绍 。 比 如 ， 代 码 为 : 


List<String> list = new LinkedList<String>(); 
list.add("a"); 
list.add("b"); 


执行 完 第 一 行 后 ， 内 部 结构 如 图 9-1 所 示 。 
添加 完 “a" 后 ， 内 部 结构 如 图 9-2 所 示 。 
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图 9-1 LinkedList 对 象 内 部 结构 : 初始 状态 
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图 9-2 ”LinkedList 对 象 内 部 结构 : 添加 一 个 元 素 后 


添加 完 和 "后 ， 内 部 结构 如 图 9-3 所 示 。 
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图 9-3 ”LinkedList 对 象 内 部 结构 : 添加 两 个 元 素 后 
可 以 看 出 ， 与 ArrayList 不 同 ，Linked-List 的 内 存 是 按 需 分 配 的 ， 不 
需要 预先 分 配 多 余 的 内 存 ， 添 加 元 素 只 需 分 配 新 元 素 的 空间 ， 然 后 调 
节 几 个 链接 即 可 。 
3. 根 据 索引 访问 元 素 get 


添加 了 元 素 ， 如 何 根据 索引 访问 元 系 呢 ? 我 们 看 下 get 方 法 的 代 


public E get(int index) { 
checkElementIndex(index); 
return node(index).item; 


} 


checkElementIndex 检 查 索 3 引 位 置 的 有 效 性 ， 如 果 无 效 ， 则 抛 出 异 
利 ， 代 码 为 : 


private void checkElementIndex(int index) { 
if(!isElementIndex(index)) 
throw new IndexOutOofBoundsException(outofBoundsMsg(index)); 


private boolean isElementIndex(int index) { 
return index >= 0 && index < size,; 
} 


如 和 革 index 有 效 ， 则 调用 node 方 法 得 找 对 应 的 万 点 ， 其 item 属 性 惑 
指 同 实际 元 素 内 容 ，node 方 法 的 代码 为 : 


Node<E> node(int index) { 
if(index < (size >> 1)) { 
Node<E> x = first; 


for(int i = 0; i < index; I++) 
x = x.next; 
return x; 
} else { 
Node<E> x = last; 
for(int i = size - 1; i > index; i--) 
x = x.prev; 
return x; 
} 
和 


size>>1 等 于 size/2， 如 果 索 引 位 置 在 前 半 部 分 (index< 
(size>>1) ) ， 则 从 头 节 点 开始 查找 ， 否 则 ， 从 尾 节 点 开始 查找 。 可 
以 看 出 ， 与 ArrayList 明 显 不 同 ，ArrayList 中 数组 元 素 连 续 存 放 ， 可 以 根 
而 在 LinkedList 中 ， 则 必须 从 头 或 尾 顺 着 链接 查找 ， 
父 2 和 4 A O 


4. 根 据 内 容 查 找 元 素 
我 们 看 下 indexOf 的 代码 : 


public int indexof(Object o) { 
int index = 0; 
if(o == null) { 
for(Node<E> x = first; x != null; x = x.next) { 
if(x.item == null) 
return index; 
IndeXx++， 
} 
} else { 
for(Node<E> x = first; x != null; x = x.next) { 
if(o.equals(x.item)) 
return index; 
index++; 


return -1; 


} 


代码 也 很 徐 单 ， 从 头 志 点 顺 着 链接 往 后 找 ， 如 果 要 找 的 是 null， 则 
找 第 一 个 item 为 null 的 万 点 ， 否 则 使 用 equals 方 法 进行 比较 。 
5. 插 入 元 素 


add 古 在 尾部 添加 元 于 ， 如 琳 在 头 部 或 中 间 插 入 元 杂 呢 ?可 以 使 用 
如 下 方法 ; 


public void add(int index, E element) 


它 的 代码 是 : 


public void add(int index, E element) { 
checkPositionIndex(index); 
if(index == size) 
linkLast(element); 
else 
linkBefore(element, node(index)); 


cm 


如 果 index 为 size， 添 加 到 最 后 面 ， 一 般 情 况 ， 是 插入 到 index 对 应 
忆 点 的 前 面 ， 调 用 方法 为 jnkBefore， 它 的 代码 为 : 


void linkBefore(E e, Node<E> succ) { 
final Node<E> pred = succ.prev; 
final Node<E> newNode = new Node<>(pred, e, succ); 
succ.prev = newNode; 
if(pred == null) 
first = newNode; 
else 
pred.next = newNode; 
Sizet+; 
modCount++; 


参数 succ 表 示 后 继 路 点， 变量 0 前 驱 方 点， 目标 是 在 pred 和 
succ 中 间 揪 入 一 个 节点 。 搬入 步 又 是 


1) 新 建 一 个 节点 newNode， 前 驱 为 pred， 后 继 为 succ。 代 码 为 : 
Node<E> newNode = new Node<>(pred, e, succ); 
2) 让 后 继 的 前 驱 指 向 新 节点 。 代 码 为 : 


succ.prev = newNode ; 


3) 让 前 驱 的 后 继 指 向 新 节点 ， 如 果 前 驱 为 空 ， 那 么 修改 关节 点 指 
回 新 万 点 。 人 代码 为 : 


if (pred == null) 

first = newNode ， 
else 

pred.next = newNode; 


4) 增加 长 度 。 
我 们 通过 图 示 来 进行 介绍 。 还 是 上 面 的 例子 ， 比 如 ， 添 加 一 个 元 


局 、 


list.add(1, "c"); 


内 存 结 构 如 图 9-4 所 示 。 


图 9-4 ”LinkedList 对 象 内 部 结构 ， 在 中 间 插 入 元 素 后 


可 以 看 出 ， 在 中 间 插 入 元 素 ，LinkedList 只 需 按 需 分 配 内 存 ， 修 改 
前 豫 和 后 继 世 点 的 链接 ， 而 ArrayList 则 可 能 需要 分 配 很 多 领 外 空间 ， 
且 移 动 所 有 后 续 元 素 。 


6. 删 除 元 又 
我 们 再 来 看 删除 元 素 ， 代 码 为 : 


public E remove(int index) { 
checkElementIndex(index); 
return unlink(node(index)); 


} 


通过 node 方 法 找到 世 点 后 ， 调 用 了 unlink 方 法 ， 代 码 为 : 


E unlink(Node<E> X) { 

final E element = x.item; 
final Node<E> next = x.next,; 
final Node<E> prev = x.prev; 
if(prev == null) { 

first = next， 
} else { 

prev.next = next,; 

x.prev = null; 


} 

if(next == null) { 
last = prev; 

} else { 
next.prev = prev; 
x.next = null,; 


x.item = null,; 
Size--， 
modCount++; 
return element,; 


删除 x 广 点 ， 基 本 思路 就 是 让 x 的 前 驱 和 后 继 直 接 链 接 起 来 ，next 是 
XxX 的 后 继 ，prev 是 x 的 前 豫 ， 有 具体 分 为 两 步 。 


1) 让 x 的 前 碟 的 后 继 指 回 x 的 后 继 。 如 果 x 没 有 前 驱 ， 说 明 删 除 的 
征 头 下 氮 ， 则 修改 头 世 点 指 同 x 的 后 继 。 


2) 让 x 的 后 继 的 前 驱 指 向 x 的 前 驱 。 如 果 x 没 有 后 继 ， 说 明 删 除 的 
苹 尾 证 点 ， 则 修改 尾 广 操 指 辣 x 的 前 驱 。 


通过 图 示 进 行 说 明 。 还 是 上 面 的 例子 ， 如 采 删 除 一 个 元 素 : 


list.remove(1); 


内 存 结构 如 图 9-5 所 示 。 
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图 9-5 ”LinkedList 对 象 内 部 结构 :删除 元 素 后 


以 上 ， 我 们 介绍 了 LinkedList 的 内 部 组 成 ， 以 及 几 个 主要 方法 的 实 
现代 码 ， 其 他 方法 的 原理 也 都 类 似 ， 我 们 就 不 络 述 了 。 


前 面 我 们 提 到 ， 对 于 队列 、 栈 和 双 端 队列 接口 ， 长 度 可 能 有 限 
制 ，LinkedList 实 现 了 这 些 接口 ， 不 过 LinkedList 对 长 度 并 没有 限制 。 
9.2.3 LinkedList 特 点 分 析 


用 法 上 ，LinkedList 是 一 个 List， 但 也 实现 了 Deque 接 口 ， 可 以 作为 
队列 、 栈 和 双 端 队列 使 用 。 实 现 原 理 上 ，LinkedList 内 部 是 一 个 双 回 链 
表 ， 并 维护 了 长 度 、 头 和 点 和 尾 节 点 ， 这 决定 了 它 有 如 下 特点 。 


1) 按 需 分 配 空间 ， 不 需要 预先 分 配 很 多 空间 。 


2) 不 可 以 随机 访问 ， 按 照 索引 位 置 访问 效率 比较 低 ， 必 须 从 头 或 
尾 顺 着 链接 找 ， 效 率 为 O(N/2) : 


3) 不 管 列表 是 否 已 排序 ， 只 要 是 按照 内 容 碍 找 元 素 ， 歼 率 都 比较 
低 ， 必 须 逐 个 比较 ， 效 率 为 0 (N) 。 

4) 在 两 端 添加 、 删 除 元 素 的 效率 很 高 ， 为 O (1) 。 

5) 在 中 间 插 入 、 删 除 元 素 ， 要 先 定 位 ， 效 率 比较 低 ， 为 O 
(N) ， 但 修改 本 身 的 效率 很 高 ， 效 率 为 O (1) 。 


理解 了 LinkedList 和 ArrayList 的 特点 ， 就 能 比较 容易 地 进行 选择 
了 ， 如 果 列 表 长 度 未 知 ， 添 加 、 删 除 操作 比较 多 ， 尤 其 经 常 从 两 端 进 
25 于? 


9.3 剖析 ArrayDeque 


LinkedList 实 现 了 队列 接口 Queue 和 双 端 队列 接口 Deque，Java 容 器 
类 中 还 有 一 个 双 端 队列 的 实现 类 ArrayDeque， 它 是 基于 数组 实现 的 。 
我 们 知道 ， 一 般 而 言 ， 由 于 需要 移动 元 素 ， 数 组 的 插入 和 删除 效率 比 
转 低 但 AneyDeque 的 效率 非常 高 它 是 怎么 实现 的 呢 ? 本 节 残 来 
十 细 打 可。 


ArrayDeque 有 如 下 构造 方法 : 


public ArrayDeque( ) 
public ArrayDeque(int numElements) 
public ArrayDeque(Collection<? extends E> c) 


numElements 表 示 元 素 个 数 ， 初 始 分 配 的 空间 会 至 少 容纳 这 么 多 元 
系 ， 但 空间 不 是 正好 numElements 这 么 大 ， 待 会 我 人 和 会 介绍 其 实现 细 
节 O 


ArrayDeque 实 现 了 Deque 接 口 ， 同 LinkedList 一 样 ， 它 的 队列 长 度 
也 是 没有 限制 的 ，Deque 扩 展 了 Queue， 有 队列 的 所 有 方法 ， 还 可 以 看 
作 栈 ， 有 懂 的 基本 万 法 push/pop/peek， 还 有 明确 的 操作 两 端的 方法 如 
addFirst/removeLast 等 ， 具 体 用 法 与 LinkedList 一 节 介 绍 的 类 似 ， 就 不 莹 
述 了 ， 下 面 看 其 实现 原理 (基于 Java 7) 。 


9.3.1 ”实现 原理 


ArrayDeque 内 部 主要 有 如 下 实例 变量 : 


private transient E[] elements,; 
private transient int head; 
private transient int tail; 


elements 就 是 存储 元 素 的 数组 。ArrayDeque 的 高 效 来 源 于 head 和 tail 
这 两 个 变量 ， 它 们 使 得 物理 上 简单 的 从 头 到 尾 的 数组 变 为 了 一 个 逻辑 


避免 了 在 头 尾 操作 时 的 移动 。 我 们 来 解释 下 循环 数组 


1. 循 环 数组 


对 于 一 般 数 组 ， 比 如 arr， 第 一 个 元 素 为 arr[0]， 最 后 一 个 为 
arr[arrlength-1]。 但 对 于 ArrayDeque 中 的 数组 ， 它 是 一 个 逻辑 上 的 循环 
数组 ， 所 谓 循 环 是 指 元 素 到 数组 尾 之 后 可 以 接着 从 数组 头 开始 ， 数 组 
` 第 一 个 和 最 后 一 个 元 素 都 与 head 和 tail 这 两 个 变量 有 关 ， 具 体 
外 -了 也: 


1) 如 果 head 和 tail 相 同 ， 则 数组 为 空 ， 长 度 为 0。 


2) 如 果 tail 大 于 head， 则 第 一 个 元 素 为 elements[head]， 最 后 一 个 为 
elements[tail-1]， 长 度 为 tail-head， 元 素 索 引 从 head 到 tail-1 。 


3) 如 果 tail 小 于 head， 且 为 0， 则 第 一 个 元 素 为 elements[head]， 最 
后 一 个 为 elements[elements.length-1]， 元 素 索 引 从 head 鲁 elements.length- 
1 O 

4) 如 朱 tail 小 于 head， 且 大 于 0， 则 会 形成 循环 ， 第 一 个 元 聚 为 
elements[head]， 最 后 一 个 是 elements[tail-1] ， 元 素 索 引 从 head 到 | 
elements.length-1， 然 后 再 从 0 到 tail-1 。 


我 们 来 看 一 些 图 示 。 第 一 种 情况 ， 数 组 为 空 ，head 和 tail 相 同 ， 如 
图 9-6 所 示 。 


第 二 种 情况 ，tail 大 于 head， 如 图 9-7 所 示 ， 都 包含 三 个 元 素 。 


图 9-7 循环 数组 ，tail 大 于 head 
第 三 种 情况 ，tail 为 0， 如 图 9-8 所 示 。 
第 四 种 情况 ，tail 不 为 0， 且 小 于 head， 如 图 9-9 所 示 。 


图 9-8 ”循环 数组 ，tail 为 0 
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图 9-9 ”循环 数组 : tail 不 为 0 且 小 于 head 


理解 了 循环 数组 的 概念 ， 我 们 来 看 ArrayDeque 一 些 主要 操作 的 代 
码 ， 先 来 看 构造 方法 。 


2. 构 造 方法 


默认 构造 方法 的 代码 为 : 


public ArrayDeque() { 
elements = (E[]) new Object[16]; 


分 配 了 一 个 长 度 为 16 的 数组 。 如 果 有 参数 humElements， 代 码 为 : 


public ArrayDeque(int numElements) { 
allocateElements(numElements); 


} 


不 是 简单 地 分 配给 定 的 长 度 ， 而 是 调用 了 allocateElements。 这 个 方 
法 的 代码 看 上 去 比较 复杂 ， 我 们 束 不 列举 了 了， 它 主要 就 是 在 计算 应 该 
分 配 的 数组 的 长 度 ， 计 算 逻 辑 如 下 : 


1) 如 果 numElements 小 于 8， 就 是 8。 


2) 在 numElements 大 于 等 于 8 的 情况 下 ， 分 配 的 实际 长 度 是 严格 大 
于 numElements 并 且 为 2 的 整数 次 需 的 最 小 数 。 比 如 ， 如 果 numElements 
为 10， 则 实际 分 配 16， 如 果 num-Elements 为 32， 则 为 64。 


为 什么 要 为 2 的 需 次 数 呢 ? 我 们 待 会 会 看 到 ， 这 样 会 使 得 很 多 操作 
的 效率 很 高 。 为 什么 要 严格 大 于 numElements 呢 ?因为 循环 数组 必须 时 


刻 至 少 留 一 个 空位 ，tail 变 量 指 回 下 一 个 空位 ， 为 了 容纳 numElements 个 
元 素 ， 至 少 需要 numElements+1 个 位 置 。 


看 最 后 一 个 构造 方法 : 


public ArrayDeque(Collection<? extends E> c) { 
allocateElements(c.size()); 
addAll(c); 


同样 调用 allocateElements 分 配 数 组 ， 随 后 调用 了 addAll， 而 addAll 
只 是 循环 调用 了 add 方 法 。 下 面 我 们 来 看 add 的 实现 。 


3. 从 尾部 添加 
add 方 法 的 代码 为 : 


public boolean add(E e) { 
addLast(e); 
return true; 


} 


addLast 的 代码 为 : 


public void addLast(E e) { 
if(e == null) 
throw new NullPpointerException(); 
elements[tail] = e; 
if( (tail]l = (tail + 1) & (elements.length - 1)) == head) 
doubleCapacity(); 


将 元 素 添 加 到 tail 处 ， 然 后 tail 指 向 下 一 个 位 置 ， 如 采 队 列 满 了 ， 则 
调用 doubleCapa-city 扩 展 数 组 。tail 的 下 一 个 位 置 是 (tail+1) & 
(elements.length-1) ， 如 果 与 head 相 同 ， 则 队列 就 满 了 。 


进行 与 操作 保证 了 索引 在 正确 范围 ， 与 (elements.length-1) 相 与 
承 可 以 得 到 下 一 个 正确 位 置 ， 是 因为 elements.length 是 2 的 需 次 方 ， 
(elements.length-1) 的 后 几 位 全 是 1， 无 论 是 正 数 还 是 负数 ， 与 
(elements.length-1) 相 与 都 能 得 到 期 望 的 下 一 个 正确 位 置 。 


比如 ， 如 果 elements.length 为 8， 则 (elements.length-1) 为 7， 二 进 
制 表 示 为 0111， 对 于 人 负数 -1， 与 7 相 与 ， 结 末 为 7， 对 于 正 数 8， 与 7 相 
与， 结果 为 0， 都 能 达到 循环 数组 中 找 下 一 个 正确 位 置 的 目的 。 这 种 位 
0 
i 


doubleCapacity 将 数组 扩大 为 两 倍 ， 代 码 为 : 


private void doubleCapacity() { 
assert head == tail,; 
int p = head; 
int n = elements.length,; 
int r = n - p; //number of elements to the right of p 
int newCapacity = n << 1; 
if(newCapacity < 0) 
throw new IllegalSstateException("Sorry, deque too big"); 
Object[] a = new Object[newCapacity]; 
System.arraycopy(elements, p, a, 0, r); 
System.arraycopy(elements, 0, a, r, p); 
elements = (E[])a; 
head = 0; 
tail = n; 


分 配 一 个 长 度 翻 倍 的 新 数组 a， 将 head 右 边 的 元 素 复制 到 新 数组 开 
头 处 ， 再 复制 左边 的 元 素 到 新 数组 中 ， 最 后 重新 设置 head 和 tail，head 
设 为 0，tail 设 为 n。 


我 们 来 看 一 个 例子 ， 假 设 原 长 度 为 8，head 和 tail 为 4， 现 在 开始 扩 
大 数组 ， 扩 大 前 后 的 结构 如 图 9-10 所 示 。 


图 9-10 ”循环 数组 ， 扩容 前 后 对 比 
add 是 在 末尾 添加 ， 我 们 再 看 在 头 部 添加 的 代码 。 


4. 从 头 部 添加 
addFirst () 方法 的 代码 为 : 


public void addFirst(E e) { 
if(e == null) 
throw new NullPpointerException(); 
elements[head = (head - 1) & (elements, length - 1)] = e; 
if(head == tail) 
doubleCapacity(); 


在 头 部 添加 ， 要 先 让 head 指 向 前 一 个 位 置 ， 然 后 再 赋值 给 head 所 在 
位 置 。head 的 前 一 个 位 置 是 (head-1) & (elements.length-1) 。 刚 开始 
head 为 0， 如 果 elements.length 为 8， 则 (head-1) & (elements.length-1) 
的 结果 为 7。 比 如 ， 执 行 如 下 代码 : 


Deque<String> queue = new ArrayDeque<>(7); 
queue.addFirst("a"); 
queue.addFirst("b"); 


执行 完 后 ， 内 部 结构 如 图 9-11 所 示 。 


图 9-11 循环 数组 ， 从 头 部 添加 后 
介绍 完了 添加 ， 下 面 来 看 删除 。 
5. 从 头 部 删除 
removeFirst 方 法 的 代码 为 : 


public E removeFirst() { 
E x = pollFirst()， 


if(x == null) 
throw new NoSuchElementException(); 
return x; 


主要 调用 了 pollFirst 方 法 ，pollFirst 方 法 的 代码 为 : 


public E pollFirst() { 
int h = head ， 
E result = elements[h]; //Element is null if deque empty 
if(result == null) 
return null; 
elements[h] = null; //Must null out slot 
head = (h + 1) & (elements.length - 1); 
return result; 


代码 比较 简单 ， 将 原 头 部 位 置 置 为 nall， 然 后 head 置 为 下 一 个 位 
二 下 一 个 位 置 为 (ht1) & & (elements.length-1) 。 从 尾部 删除 的 代码 
是 类 似 的 ， 就 不 敬 述 了 。 
查看 长 度 


ArrayDeque 没 有 单独 的 字段 维护 长 度 ， 其 size 方 法 的 代码 为 : 


public int size() { 
return (tail - head) & (elements ,Jength - 1); 
} 


通过 该 方法 即 可 计算 出 size 。 
7. 检 查 给 定 元 素 是 否 存在 


contains 方 法 的 代码 为 : 


public boolean contains(Object 0) { 
if(o == null) 
return false; 
int mask = elements.length - 1; 
int i = head， 
Ex» 
while( (x = elements[i]) != nul1) { 
if(o.equals(x)) 
return true; 
i= (i+ 1) & mask; 


return false， 


} 


就 是 从 head 开 始 裔 历 并 进行 对 比 ， 循 环 过 程 中 没有 使 用 tail， 而 是 
到 元 素 为 null 就 结束 了 ， 这 是 因为 在 ArrayDeque 中 ， 有 效 元 素 不 允许 为 


null 。 
StoAiray 方 法 
toArray 方 法 的 代码 为 : 


public Object[] toArray() { 
return copyElements(new Object[size()]); 


copyElements 的 代码 为 : 


private <T> T[] copyElements(T[] a) { 
if(head < tail) { 
System.arraycopy(elements, head, a, 0, size()); 
} else if(head > tail) { 
int headPortionLen = elements.length - head; 
System.arraycopy(elements, head, a, 0, headPortionLen); 
System.arraycopy(elements, 0, a, headPortionLen, tail); 


return a; 


} 


如 果 head 小 于 tail， 就 是 从 head 开 始 复 制 size 个 ， 否 则 ， 复 制 逻辑 与 
doubleCapacity 方 法 中 的 类 似 ， 先 复制 人 head 到 末尾 的 部 分 ， 然 后 复制 
从 0 到 tail 的 部 分 。 


9. 原 理 小 结 
以 上 就 是 ArrayDeque 的 基本 原理 ， 内 部 它 是 一 个 动态 扩展 的 循环 


数组 ， 通 过 head 和 tail 变 量 维护 数组 的 开始 和 结尾 ， 数 组 长 度 为 2 的 时 次 
方 ， 使 用 高 效 的 位 操作 进行 各 种 判断 ， 以 及 对 head 和 tail 进 行 维 护 。 


9.3.2 ”ArrayDeque 特 点 分 析 


ArrayDeque 实 现 了 双 端 队列 ， 内 部 使 用 循环 数组 实现 ， 这 决定 了 
它 有 如 下 特点 。 


1) 在 两 端 添加 、 删 除 元 素 的 效率 很 高 ， 动 态 扩展 需要 的 内 存 分 配 
人 具体 来 说 ， 添 加 N 个 元 素 的 效率 为 9 
N Oo 


2) 根据 元 素 内 容 查 找 和 删除 的 效率 比较 低 ， 为 O(N) 。 


3) 与 ArrayList 和 LinkedList 不 同 ， 没 有 索引 位 置 的 概念 ， 不 能 根据 
索引 位 置 进行 操作 。 


ArrayDeque 和 LinkedList 都 实现 了 Deque 接 口 ， 应 该 用 哪 一 个 呢 ? 
如 果 只 需要 Deque 接 口 ， 从 两 端 进 行 操作 ， 一 般 而 言 ，ArrayDeque 歼 率 
更 高 一 些 ， 应 该 被 优先 使 用 ， 如 果 同 时 需要 根据 索引 位 置 进行 操作 ， 
或 者 经 常 需要 在 中 间 进 行 插入 和 删除 ， 则 应 该 选 LinkedList 。 


至 此 ， 天 于 列表 和 队列 的 内 容 束 介绍 完了 ， 无 论 是 ArrayList、 
LinkedList 还 是 Array-Deque， 按 内 容 查 找 元 素 的 效率 都 很 低 ， 都 需要 还 
个 进行 比较 ， 有 没有 更 有 效 的 方式 呢 ? 让 我 们 下 一 草 来 看 各 种 Map 和 
Set 。 


第 10 草 Map 和 Set 


上 一 间 介 绍 了 ArrayList、LinkedList 和 ArrayDeque， 它 们 的 一 个 共 
同 特 点 是 : 查找 元 素 的 效率 都 比较 低 ， 都 需要 逐个 进行 比较 ， 本 章 介 
绍 各 种 Map 和 Set， 它 们 的 查找 效率 要 高 得 多 。Map 和 Set 都 是 接 口 ， 
Java 中 有 多 个 实现 类 ， 主 要 包括 HashMap、HashSet、TreeMap、 
TreeSet、 LinkedHashMap、LinedHashSet、EnumMap、EnumSet 等 ， 它 
们 都 有 什么 用 ? 有 什么 不 同 ? 是 如 何 实现 的 ? 本 章 进 行 深 入 谢 析 ， 我 
们 先 从 最 常用 的 HashMap 开 始 。 


10.1 ”剖析 HashMap 


字面 上 看 ，HashMap 由 Hash 和 Map 两 个 单词 组 成 ， 这 里 Map 不 是 地 
图 的 意思 ， 而 是 表示 映射 关系， 是 一 个 接口 ， 实 现 Map 接 口 有 多 种 方 
式 ，HashMap 实 现 的 方式 利用 了 哈 希 (Hash) 。 下 面 先 来 看 Map 接 口 ， 
和 用 法 ， 然 后 看 实现 原理 ， 最 后 总 结 分 析 HashMap 的 特 


10.1.1 Map 接口 


Map 有 键 和 值 的 概念 。 一 个 键 映 射 到 一 个 值 ，Map 按 照 键 存储 和 
访问 值 ， 键 不 能 重复 ， 即 一 个 键 只 会 存储 一 份 ， 给 同一 个 键 重 复 设 值 
人 。 使 用 Map 可 以 方便 地 处 理 需 要 根据 键 访问 对 象 的 场 
景 ， 比 如 : 


一 个 词典 应 用 ， 键 可 以 为 单词 ， 值 可 以 为 单词 信息 类 ， 包 括 合 
义 、 发 音 、 例 句 等 ; 


-统计 和 记录 一 本 书 中 所 有 单词 出 现 的 次 数 ， 可 以 以 单词 为 键 ， 以 
出 现 次 数 为 值 ; 


-管理 配置 文件 中 的 配置 项 ， 配 置 项 是 典型 的 健 值 对 ; 
.根据 身份 证 号 查询 人 员 信 息 ， 吴 份 证 号 为 键 ， 人 员 信 息 为 值 。 


数组 、ArrayList、LinkedList 可 以 视 为 一 种 特殊 的 Map ， 键 为 索 
引 ， 值 为 对 象 。 


Java 7 中 Map 接 口 的 定义 如 代码 清单 10-1 所 示 ， 用 注释 表示 方法 的 


代码 清单 10-1 ”Map 接口 


public interface Map<K,V> { //K 和 V 是 类 型 参数 ， 分 别 表 示 键 (Key ) 和 值 (Value ) 的 类 型 
V put(K key，V value); // 保 存 键 值 对 ， 如 果 原 来 有 key， 履 盖 ， 返 回 原来 的 值 
V get(0bject key); // 根 据 键 获取 值 ， 没 找到 ， 返 回 nu11 
V _ remove(0bject key); // 根 据 键 删除 键 值 对 ， 返 回 key 原 来 的 值 ， 如 果 不 存在 ， 返 回 nul1 


int size(); // 查 看 Map 中 键 值 对 的 个 数 
boolean isEmpty()， // 是 否 为 空 
boolean containsKey(0bject key); // 碍 看 是 否 包含 某 个 键 
boolean containsValue(0bject value); // 查 看 是 否 包 含 某 个 值 
void putAll(Map<? extends K，? extends V> m);// 保 存 m 中 的 所 有 键 值 对 到 当前 Map 
void clear(); // 清 空 Map 中 所 有 键 值 对 
Set<K> keySet(); // 获 取 Map 中 键 的 集合 
Collection<V> values( ); // 获 取 Map 中 所 有 值 的 集合 
Set<Map.Entry<K，V>> entrySet(); // 获 取 Map 中 的 所 有 键 值 对 
interface Entry<K,V> { // 稚 套 接口 ， 表 示 一 条 键 值 对 

K getKey( ); // 键 值 对 的 键 

V getValue( ) ; // 键 值 对 的 值 

V SetValue(V value); 

boolean equals(Object 0)， 

int hashCode(); 


boolean equals(Object 0o); 
int hashCode(); 


boolean containsValue(Object value); 
Set<k> keySet(); 


Java 8 增加 了 一 些 默认 方法 ， 如 getOrDefault、forEach、 
replaceAll 、 putIfAbsent 、replace、 computelfAbsent、merge 等 ，Java 9 增 
加 了 多 个 重 载 的 of 方法 ， 可 人 
Map， 具 体 可 参见 API 文 档 ， 我 们 就 不 介 


Set 是 一 个 接口 ， 表 示 的 是 数学 中 的 集合 概念 ， 即 没有 重复 的 元 素 
集合 。Java 7 中 的 Set 定 义 为 : 


public interface Set<E> extends Collection<E> { 


它 扩展 了 Collection， 但 没有 定义 任何 新 的 方法 ， 不 过 ， 它 要 求 所 
有 实现 者 都 必须 确保 Set 的 语义 约束 ， 即 不 能 有 重复 元 素 。Java 9 增加 了 
多 个 重 载 的 of 方法 ， 可 以 根据 一 个 或 多 个 元 素 生 成 不 变 的 Set， 具 体 可 
参见 API 文 档 。 关 于 Set，10.2 节 我 们 再 详细 介绍 。 


Map 中 的 键 是 没有 重复 的 ， 所 以 ketSet () 返回 了 一 个 Set。keySet 
U 、values () 、entrySet () 有 一 个 共同 的 特点 ， 它 们 返回 的 都 是 
视图 ， 不 是 复制 的 值 ， 基 于 返回 值 的 修改 会 直接 修改 Map 目 喘 ， 比 如 : 


map ,keySet().clear()， 


会 删除 所 有 键 值 对 。 
10.1.2 HashMap 


HashMap 实 现 了 Map 接 口 ， 我 们 通过 一 个 简单 的 例子 来 看 如 何 使 
用 。 在 7.6 节 ， 我 们 介绍 过 如 何 产 生 随 机 数 ， 现 在 ， 我 们 写 一 个 程序 ， 
来 看 随机 产生 的 数 是 否 均 习 。 比 如 ， 随 机 产生 1000 个 0~3 的 数 ， 统 计 
每 个 数 的 次 数 ， 如 代码 清单 10-2 所 示 。 


代码 清单 10-2 ”使 用 HashMap 统 计 随 机 数 


Random rnd = new Random( ) ， 
Map<Integer, Integer> countMap = new HashMap<>() 
for(int i=0; i<1000; i++){ 
int num = rnd.nextInt(4); 
Integer count = countMap.get(num); 
if(count==null1)f{ 
countMap.put(num, 1); 
}elsef 
countMap.put(num, count+1); 
} 


for(Map.Entry<Integer, Integer> kv : countMap.entrySet()){ 
System.out.printin(kv.getkey()+","+kv.getValue()); 


一 次 运行 的 输出 为 : 


0, 269 
1, 236 
2,261 
3, 234 


次 数 分 别 是 269、236、261、234， 代 码 比 较 简 单 ， 就 不 解释 了 。 
除了 默认 构造 方法 ，HashMap 还 有 如 下 构造 方法 : 


public HashMap(int initialCcapacity) 
public HashMap(int initialCcapacity, float loadFactor) 
public HashMap(Map<? extends Kk, ? extends V> m) 


最 后 一 个 以 一 个 已 有 的 Map 构 造 ， 复 制 其 中 的 所 有 键 值 对 到 当前 
Map。 前 两 个 涉及 参数 initialCapacity 和 ]loadFactor， 它 们 是 什么 意思 


呢 ? 我 们 需要 看 下 HashMap 的 实现 原理 。 
10.1.3 ”实现 原理 


我 们 先 来 看 HashMap 的 内 部 组 成 ， 然 后 分 析 一 些 主要 方法 的 实 
现 ， 代 码 基 于 Java 7。 


1. 内 部 组 成 
HashMap 内 部 有 如 下 几 个 主要 的 实例 变量 : 


transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE; 
transient int size,; 

int threshold,; 

final float loadFactor; 


Size 表示 实际 键 值 对 的 个 数 。table 是 一 个 Entry 类 型 的 数组 ， 称 为 哈 
布 表 或 哈 希 桶 ， 其 中 的 每 个 元 素 指 向 一 个 单 同 链表 ， 链 表 中 的 每 个 六 
Be °。Entry 是 一 个 内 部 类 ， 它 的 实例 变量 和 构造 方法 代 
马 如 下 : 


static class Entry<K,V> implements Map .Entry<K,V> { 
final K key; 
V Value 
Entry<K,V> next,; 
int hash; 
Entry(int h, K k, V v, Entry<K,V> n) { 
Value = v; 
next = n,; 
key = k; 
hash = h; 
} 
} 


其 中 ，key 和 value 分 别 表示 键 和 值 ，next 指 癌 下 一 个 Entry 世 点 ， 
hash 是 key 的 hash 值 ， 待 会 我 们 会 介绍 其 计算 方法 。 直 接 存 储 hash 值 是 
为 了 在 比较 的 时 候 加 快 计 算 ， 符 会 我 们 看 代码 。 


table 的 初始 值 为 EMPTY_ TABLE， 是 一 个 空 表 ， 上 有 具体 定义 为 : 


static final Entry<?,?>[] EMPTY_TABLE = {}; 


当 添 加 键 值 对 后 ，table 束 不 是 空 表 了 ， 它 会 随 着 键 值 对 的 添加 进 
行 扩 展 ， 扩 展 的 策略 类 似 于 ArrayList。 添 加 第 一 个 元 素 时 ， 默 认 分 配 
的 大 小 为 16， 不 过 ， 并 不 是 size 大 于 16 时 再 进行 扩展 ， 下 次 什么 时 候 扩 
展 与 threshold 有 关 。 


threshold 表 示 贱 值 ， 当 键 值 对 个 数 size 大 于 等 于 threshold 时 考虑 进 
行 扩 展 。threshold 是 怎么 算出 来 的 呢 ? 一 般 而 言 ，threshold 等 于 
table.length 乘 以 loadFactor。 比如， 如 采 table.length 为 16，loadFactor 为 
0.75， 则 threshold 为 12。loadFactor 是 负载 因子 ， 表 示 整 体 上 table 被 占用 
的 程度 ， 是 一 个 浮 点 数 ， 默 认为 0.75， 可 以 通过 构造 方法 进行 修改 。 


下 面 ， 我 们 通过 一 些 主要 方法 的 代码 来 介绍 HashMap 是 如 何 利 用 
这 些 内 部 数据 实现 Map 接 口 的 。 先 看 默认 构造 方法 。 需 要 说 明 的 是 ， 为 
清晰 和 简单 起 见 ， 我 们 可 能 会 省 略 一 些 非 主要 代码 。 
2. 默 认 构 造 方法 

默认 构造 方法 的 代码 为 : 


public HashMap() { 
this(DEFAULT_INITIAL CAPACITY, DEFAULT_LOAD_FACTOR); 
} 


DEFAULT INITIAL CAPACITY 为 16， 
DEFAULT LOAD_FACTOR 为 0.75， 默 认 构 造 方法 调用 的 构造 方法 主要 
代码 为 : 


public HashMap(int initialCapacity, float loadFactor) { 
this.loadFactor = loadFactor; 
threshold = initialCapacity; 

} 


主要 就 是 设置 loadFactor 和 threshold 的 初始 值 。 
3. 保 存 键 值 对 
四 下 面 ， 我 们 来 看 HashMap 是 如 何 把 一 个 键 值 对 保存 起 来 的 ， 代 码 


public V put(K key, V value) { 
if(table == EMPTY_TABLE) { 
inflateTable(threshold); 


} 
if(key == null) 
return putForNullkey(value); 
int hash = hash(key); 
int i = indexFor(hash, table.length); 
for(Entry<K,V> e = table[il]; e != null; e = e.next) { 
Object k; 
if(e.hash == hash && ((k = e.key) == key || key.equals(k))) { 
V oldValue = e.value,; 
e.value = value; 
e.recordAccess(this); 
return oldValue; 


} 


modCount++; 
addEntry(hash, key, value, i); 
return null; 


如 果 是 第 一 次 保存 ， 首 先 调用 inflateTable () 方法 给 table 分 配 实际 
的 空间 ，inflateTable 的 主要 代码 为 : 


private void inflateTable(int toSize) { 
//Find a power of 2 >= toSize 
int capacity = roundUpToPowerOf2(toSize),; 
threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_ CAPACITY + 1); 
table = new Entry[capacity]; 
} 


默认 情况 下 ，capacity 的 值 为 16，threshold 会 变 为 12，table 会 分 配 
一 个 长 度 为 16 的 Entry 数 组 。 接 下 来 ， 检 查 key 是 否 为 null， 如 果 是 ， 调 
用 putForNullKey 单 独处 理 ， 我 们 暂时 忽略 这 种 情况 。 在 key 不 为 null 的 
情况 下 ， 下 一 步调 用 hash 方 法 计算 key 的 hash 值 。hash 方 法 的 代码 为 : 


final int hash(Object k) { 
int h=0 
h ^= k.hashcode(); 
h A= (h >>> 20) 人 (h >>> 12); 
return h ^ (h >>> 7) ^ (h >>> 4); 


基于 key 目 刁 的 hashCode 方 法 的 运 回 值 又 进行 了 一 些 位 运算 ， 目的 
是 为 了 随机 和 均匀 性 。 有 了 hash 值 之 后 ， 调 用 indexFor 方 法 ， 计 算 应 该 
将 这 个 键 值 对 放 到 table 的 哪个 位 置 ， 代 码 为 : 


static int indexFor(int h, int length) { 
return h & (length-1); 


HashMap 中 ，length 为 2 的 怖 次 方 ，h& (length-1) 等 同 于 求 模 运算 
ho%length。 找 到 了 保存 位 置 1，table[i] 指 向 一 个 单 向 链表 。 接 下 来 ， 就 
是 在 这 个 链表 中 逐个 查找 是 否 已 经 有 这 个 键 了 ， 遍 历代 码 为 : 


for (Entry<K,V> e = table[i]; e != null; e = e.next) 


而 比较 的 上 时候， 是 先 比 较 hash 值 ，hash 相 同 的 上 时候 ， 再 使 用 equals 
方法 进行 比较 ， 代 码 为 : 


if(e.hash == hash && ((k = e.key) == key || key.equals(k))) 


为 什么 要 先 比 较 hash 呢 ?因为 hash 是 整数 ， 比 较 的 性 能 一 般 要 比 
equals 高 很 多 ，hash 不 同 ， 束 没有 必要 调用 equals 方 法 了 ， 这 样 整体 上 
可 以 提高 比较 性 能 。 如 有 果 能 找到 ， 直 接 修改 Entry 中 的 value 妈 可。 
modCount++ 的 含义 与 ArrayList 和 LinkedList 中 介绍 一 样 ， 为 记录 修改 次 
数 ， 方 便 在 送 代 中 检测 结构 性 变化 。 如 有 果 没 找到 ， 则 调用 addEntry 方 法 
在 给 定 的 位 置 添加 一 条 ， 代 码 为 : 


void addEntry(int hash，K key, V value, int bucketIndex) { 
if((size >= threshold) && (null != table[bucketIndex])) { 
resize(2 * table.1length); 
hash = (null != key) ? hash(key) : 0; 
bucketIndex = indexFor(hash, table.length); 


createEntry(hash, key, value, bucketIndex); 


如 果 空 间 是 够 的 ， 不 需要 resize， 则 调用 createEntry 方 法 添加 。 
createEntry 的 代码 为 : 


void createEntry(int hash，K key, V value, int bucketIndex) { 
Entry<K,V> e = table[bucketIindex]; 
table[bucketIndex] = new Entry<>(hash, key, value, e); 
Sizet++; 


代码 比较 直接 ， 新 建 一 个 Entry 对 象 ， 插 入 单 辐 链表 的 头 部 ， 并 增 
加 size。 如 果 空 间 不 够 ， 即 Size 已 经 要 超过 赋值 threshold 了 ， 并 且 对 应 的 
table 位 置 已 经 插入 过 对 象 了 ， 有 具体 检查 代码 为 : 


if((size >= threshold) && (null != table[bucketIndex])) 


则 调用 resize 方 法 对 table 进 行 扩展 ， 扩 展 党 上 略 是 乘 2，resize 的 主要 
代码 为 : 


void resize(int newCapacity) { 
Entry[] oldTable = table,; 
int oldCapacity = oldTable.length,; 
Entry[] newTable = new Entry[newCapacity]; 
transfer(newTable, initHashSeedAsNeeded(newCapacity)); 
table = newTable; 
threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1); 


分 配 一 个 容量 为 原来 两 倍 的 Entry 数 组 ， 调 用 transfer 方 法 将 原来 的 
键 值 对 移植 过 来 ， 然 后 更 新 内 部 的 table 变 量 ， 以 及 threshold 的 值 。 
transfer 方 法 的 代码 为 : 


void transfer(Entry[] newTable, boolean rehash) { 
int newCapacity = newTable.length,; 
for(Entry<K,V> e : table) { 
while(null] != e) { 
Entry<K,V> next = e.next,; 
if(rehash) { 
e.hash = null == e.key ? 0 : hash(e.key); 


int i = indexFor(e.hash, newCapacity),; 
e.next = newTable[i]; 

newTable[i] = e; 

e = next,; 


参数 rehash 一 般 为 false。 这 上 段 代 码 遍 历 原来 的 每 个 键 值 对 ， 计 算 新 
位 置 ， 并 保存 到 新 位 置 ， 具 体 代码 比较 直 授 ， 就 不 解释 了 。 


以 上 束 是 保存 键 值 对 的 主要 代码 ， 简 单 总 结 一 下 ， 基 本 步骤 为 : 
1) 计算 键 的 哈 希 值 ; 


2) 根据 哈 希 值得 到 保存 位 置 《 取 模 ) ， 
3) 揪 到 对 应 位 置 的 链表 头 部 或 更 新 已 有 值 ; 
4) 根据 需要 扩展 table 大 小 。 


以 上 接 述 可 能 比较 抽象 ， 我 们 通过 一 个 例子 ， 用 图 示 的 方式 进行 
说 明 ， 代 码 如 下 : 


Map<String,Integer> countMap = new HashMap<>(); 
countMap.put("hello", 1); 
countMap.put("world", 3); 
countMap.put("position", 4); 


在 通过 new HashMap () 创建 一 个 对 象 后 ， 内 存 中 的 结构 如 图 10-1 
PRS 


size | 0 | 


图 10-1 HashMap: 初始 结构 


接 下 来 执行 保存 键 值 对 的 代码 ，"hello" 的 hash 值 为 96207088， 模 16 
的 结果 为 0， 所 以 插入 table[0] 指 向 的 链表 头 部 ， 内 存 结构 变 为 图 10-2 所 
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"world" 的 hash 值 为 111207038， 模 16 结 果 为 14， 所 以 保存 
完 "world" 后 ， 内 存 结构 如 图 10-3 所 示 。 


图 10-2 ”HashMap 对 象 示例 : 保存 一 个 键 值 对 后 
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value| 1 
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key | “world” 
lue 3 


next null 
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图 10-3 HashMap 对 象 示例 : 保存 两 个 键 值 对 后 


"position" 的 hash 值 为 771782464， 模 16 结 果 也 为 0，table[0] 已 经 有 
节点 了 ， 新 节点 会 揪 到 链表 头 部 ， 内 存 结构 变 为 如 图 10-4 所 示 。 理 解 了 
键 值 对 在 内 存 是 如 何 存放 的 ， 束 比较 容易 理解 其 他 方法 了 。 
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next| null 


图 10-4 HashMap 对 象 示例 : 保存 三 个 键 值 对 后 
4. 查 找 方法 
根据 键 获 取 值 的 get 方 法 的 代码 为 : 


public V get(Object key) { 
if(key == null) 
return getForNullkey!(); 
Entry<K,V> entry = getEntry(key); 
return null == entry ? null : entry.getValue(); 


} 


HashMap 支 持 key 为 null，key 为 null 的 时 候 ， 放 在 table[0]， 调 用 
getForNullKey () 获取 值 ， 如 果 key 不 为 null， 则 调用 getEntry () 获取 
键 值 对 方 点 entry， 然 后 调用 节点 的 getValue () 方法 获取 值 。getEntry 
方法 的 代码 是 : 


final Entry<K,V> getEntry(Object key) { 
if(size == 0) { 
return null; 


} 
int hash = (key == null) ? 0 : hash(key); 
for(Entry<K,V> e = table[indexFor(hash, table.length)]; 


e != null; e = e.next) { 
Object k; 
if(e.hash == hash && 


((k = e.key) == key || (key != null && key.equals(k)))) 
return e; 


return null; 


} 
逻辑 也 比较 简单 ， 具 体 如 下 。 
1) 计算 键 的 hash 值 ， 代 码 为 : 


int hash = (key == null) ? 0 : hash(key); 


2) 根据 hash 找 到 table 中 的 对 应 链表 ， 代 码 为 : 


table[indexFor(hash, table.length)]; 


3) 在 链表 中 遍历 查找 ， 换 历代 码 : 


for(Entry<K,V> e = table[indexFor(hash, table.length)]; 
e != null; e = e.next) 


让 可 逐个 比较 ， 先 通过 hash 快 速 比 较 ，hash 相 同 再 通过 equals 比 较 ， 
人 码 为 : 


if(e.hash == hash && 
((k = e.key) == key || (key != null && key.equals(k)))) 


containsKey 方 法 的 逻辑 与 get 是 类 似 的 ， 节 扣 不 为 null 束 表示 存在 ， 
具体 代码 为 : 


public boolean containskey(Object key) { 
return getEntry(key) != null,; 


HashMap 可 以 方便 高 效 地 按照 键 进行 操作 ， 但 如 果 要 根据 值 进行 
操作 ， 则 需要 遍历 ，containsValue 方 法 的 代码 为 : 


public boolean containsValue(Object value) { 
if(value == null) 
return containsNullValue(); 
Entry[] tab = table; 
for(int i = 0; i < tab.length ; i++) 
for(Entry e = tab[i] ) e != null ; e = e.next) 
if(value.equals(e.value)) 
return true; 
return false; 


如 果 要 查找 的 值 为 null， 则 调用 containsNullValue 单 独 人 处理， 如果 
要 查找 的 值 不 为 null， 遍 历 的 逻辑 也 很 简 单 ， 束 是 从 table 的 第 一 个 链表 
开始 ， 从 上 到 下 ， 从 左 到 右 逐 个 节点 进行 访问 ， 通 过 equals 方 法 比较 
值 ， 直 到 找到 为 止 。 


5. 根 据 键 删除 键 值 对 
根据 键 删除 键 值 对 的 代码 为 : 


public V remove(Object key) { 
Entry<K,V> e = removeEntryForKey(key ) ， 
return(e == null ? null : e.value); 


removeEntryForKey 的 代码 为 : 


final Entry<K,V> removeEntryForKkey(Object key) { 
if(size == 0) { 
return null; 


} 
int hash = (key == null) ? 0 : hash(key); 
int i = indexFor(hash, table.1length); 
Entry<K,V> prev = table[il]; 
Entry<K,V> e = prev; 
while(e != nul1) { 
Entry<K,V> next = e.next, 
Object k; 
if(e.hash == hash && 
((k = e.key) == key || (key != null && key.equals(k)))) { 
modCount++; 
Size--， 
if(prev == e) 
table[i] = next; 


else 

prev.next = next,; 
e.recordRemoval( this); 
return e; 


return e; 


基本 逻辑 分 析 如 下 。 
1) 计算 hash， 根 据 hash 找 到 对 应 的 table 索 引 ， 代 码 为 : 


int hash = (key == null) ? 0 : hash(key); 
int i = indexFor(hash, table.1length); 


2) 遍历 table[ 计 |， 查 找 待 删节 使 用 变量 prev 指 问 前 一 个 节点 ， 
next 指 癌 后 一 个 和 点 ，e 指 同 当 遍历 结构 代码 为 : 


Entry<K,V> prev = table[i]; 
Entry<K,V> e = prev; 
while(e != nul1) { 
Entry<K,V> next = e.next,; 
if( 找 到 了 ){ 
// 删 除 


return; 


3) 判断 是 否 找到 ， 依 然 是 先 比较 hash 值 ，hash 值 相同 时 再 用 equals 
方法 比较 % 


4) 删除 的 逻 减 小 ， 然 后 让 竺 删节 点 的 前 后 和 点 链 起 
人 待 删节 点 是 第 一 个 世 点 ， 出 IE dle 直接 指向 后 一 下 


Size--， 

if(prev == e) 
table[i] = next; 

else 


prev.next = next; 


e.recordRemoval (this) ; 在 HashMap 中 代码 为 空 ， 主 要 是 为 了 
HashMap 的 子 类 扩展 使 用 。 


6. 实 现 原 理 小 结 


以 上 束 是 HashMap 的 基本 实现 原理 ， 内 部 有 一 个 哈 希 表 ， 即 数组 
table， 每 个 元 素 table[j 指 加 一 个 单 辐 链表， 根据 键 存 取 值 ， 用 键 算 出 
hash 值 ， 取 模 得 到 数组 中 的 索引 位 置 buketIndex， 然 后 操作 
table[buketIndex] 指 辣 的 单 癌 链表 。 


存 取 的 时 候 依 据 键 的 hash 值 ， 只 在 对 应 的 链表 中 操作 ， 不 会 访问 别 
的 链表 ， 在 对 应 链表 操作 时 也 是 移 比 较 hash 值 ， 如 果 相 同 再 用 equals 方 
法 比较 。 这 就 要 求 ， 相 同 的 对 象 其 hashCode 返 回 值 必须 相同 ， 如 果 键 
是 自 定 义 的 类 ， 就 特别 需要 注意 这 一 点 。 这 也 是 hash-Code 和 equals 方 法 
的 一 个 关键 约束 。 


需要 说 明 的 是 ，Java 8 对 HashMap 的 实现 进行 了 优化 ， 在 哈 希 冲突 
比较 严重 的 情况 下 ， 即 大 量 元 素 映 射 到 同一 个 链表 的 情况 下 (具体 是 
至 少 8 个 元 素 ， 且 总 的 键 值 对 个 数 至 少 是 64) ，Java 8 会 将 该 链表 转换 
为 一 个 平衡 的 排序 二 又 树 ， 以 提高 查询 的 效率 ， 关 于 排序 二 又 树 我 们 
在 10.3 节 介绍，Java 8 的 具体 代码 就 不 介绍 了 。 


hi 


本 世人 介绍 了 HashMap 的 用 法 和 实现 原理 ， 它 实现 了 Map 接 口 ， 可 以 
方便 地 按照 键 存 取 值 ， 内 部 使 用 数组 链表 和 哈 希 的 方式 进行 实现 ， 这 
决定 了 它 有 如 下 特点 : 


1) 根据 键 保存 和 获取 值 的 效率 都 很 高 ， 为 O0 (1) ， 每 个 单 向 链表 
往往 只 有 一 个 或 少数 儿 个 下 点 ， 根 据 hash 值 束 可 以 直接 快速 定位 ; 

2) HashMap 中 的 键 值 对 没有 顺序 ， 因 为 hash 值 是 随机 的 。 

如 采 经 常 需要 根据 键 存 取 值 ， 而 且 不 要 求 顺 序 ， 那 么 HashMap 整 
征 理想 的 选择 。 如 果 要 保持 添加 的 顺序 ， 可 以 使 用 HashMap 的 一 个 子 


类 LinkedHashMap， 我 们 在 10.6 节 介绍 。Map 还 有 一 个 重要 的 实现 类 
TreeMap， 它 可 以 排序 ， 我 们 在 10.4 节 介绍 。 


需要 说 明 的 是 ，HashMap 不 是 线程 安全 的 ，Java 中 还 有 一 个 类 
Hashtable， 它 是 Java 最 早 实现 的 容器 类 之 一 ， 实 现 了 Map 接 口 ， 实 现 原 
理 与 HashMap 类 似 ， 但 没有 特别 的 优化 ， 它 内 部 通过 synchronized 实 现 
了 线程 安全 。 在 HashMap 中 ， 键 和 值 都 可 以 为 null， 而 在 Hashtable 中 不 
可 以 。 在 不 需要 并 发 安全 的 场景 中 ， 推 荐 使 用 HashMap。 在 高 并 发 的 
场景 中 ， 推 荐 使 用 17.2 节 介绍 的 ConcurrentHashMap。 


根据 哈 希 值 存 取 对 象 、 比 较 对 象 古 计算 机 程序 中 一 种 重要 的 思维 
方式 ， 它 使 得 存 取 对 和 象 主要 依赖 于 自身 Hash 值 ， 而 不 是 与 其 他 对 象 进 
行 比较 ， 存 取 效 率 也 与 集合 大 小 无 关 ， 高 达 O (1) ， 即 使 进行 比较 ， 
也 利用 Hash 值 提高 比较 性 能 。 


10.2 ”剖析 HashSet 


10.1 市 提 到 了 Set 接 口 ，Map 接 口 的 两 个 方法 keySet 和 entrySet 返 回 
的 都 是 Set， 本 闻 介 绍 Set 接 口 的 一 个 重要 实现 类 HashSet。 与 HashMap 
类 似 ， 字 面 上 看 ，HashSet 由 两 个 单词 组 成 :Hash 和 Set。 其 中 ，Set 表 
示 接 口 ， 实 现 Set 接 口 也 有 多 种 方式 ， 各 有 特点 ，Hash- Set 实 现 的 方式 
利用 了 Hash。 下 面 ， 我 们 先 来 看 HashSet 的 用 法 ， 然 后 看 实现 原理 ， 最 
后 总 结 分 析 HashSet 的 特点 。 


10.2.1 用 法 


我 们 先 介 绍 Sat 接口， 然后 介绍 HashSset 的 使 用 和 应 用 场景 。 

Set 表 示 的 是 没有 重复 元 素 、 且 不 保证 顺序 的 容器 接口 ， 它 扩展 了 
Collection， 但 没有 定义 任何 新 的 方法 ， 不 过 ， 对 于 其 中 的 一 些 方法 ， 
它 有 自己 的 规范 。Set 接 口 的 完整 定义 如 代码 清单 10-3 所 示 。 


代码 清单 10-3 ”Set 接口 


public interface Set<E> extends Collection<E> { 

int size(); 

boolean isEmpty(); 

boolean contains(Object 0)， 

// 和 迭代 遍 历时 ， 不 要 求 元 素 之 间 有 特别 的 顺序 

//HashSet 的 实现 就 是 没有 顺序 ， 但 有 的 Set 实 现 可 能 会 有 特定 的 顺序 ， 比 如 TreeSet 
Iterator<E> iterator(); 

Object[] toArray( ) ， 

<T> T[] toArray(T[] a); 
// 添 加 元 素 ， 如果 集 合 中 已 经 存在 相同 元 素 了 ， 则 不 会 改变 集合 ， 直 接 返 回 false， 
// 只 有 不 存在 时 ， 才 会 添加 ， 并 返回 true 

boolean add(E e); 
boolean remove(Object 0o); 

boolean containsAll(Collection<?> c); 

// 重 复 的 元 素 不 添加 ， 不 重复 的 添加 ， 如 果 集 合 有 变化 ， 返 回 true， 没 变化 返回 false 
boolean addAll(Collection<? extends E> c); 

boolean retainAll(Collection<?> C)， 

boolean removeAll(Collection<?> C)， 

void clear(); 

boolean equals(Object 0o); 

int hashcode()， 


ei 


与 HashMap 类 似 ，HashSet 的 构造 方法 有 : 


public HashSet( ) 

public HashSet(int initialCapacity) 

public HashSet(int initialCapacity, float loadFactor) 
public HashSet(Collection<? extends E> c) 


initialCapacity 和 loadFactor 的 含义 与 HashMap 中 的 是 一 样 的 。 
HashSet 的 使 用 也 很 简单 ， 比 如 : 


Set<String> set = new HashSet<String>(); 
set.add("hello"); 
set.add("world"); 
set.addAll(Arrays.asList(new String[]{"hello", " 老 马 "})); 
for(String s : Set){ 

System,.out.print(s+" "); 
} 


输出 为 : 
hello 老 马 world 


"hello" 被 添加 了 两 次 ， 但 只 会 保存 一 份 ， 输 出 也 没有 什么 特别 的 
顺序 。 


与 HashMap 类 似 ，HashSet 要 求 元 素 重 写 hashCode 和 equals 方 法 ， 
且 对 于 两 个 对 象 ， 如 有 末 equals 相 同 ， 则 hashCode 也 必须 相同 ， 如 果 元 素 
是 自 定 义 的 类 ， 需 要 注意 这 一 点 。 比 如 ， 有 一 个 表示 规格 的 类 Spec， 
有 大 小 和 颜色 两 个 属性 : 


class Spec { 
String size,; 
String color; 
public Spec(String size, String color) { 
this.size = size; 
this.color = color,; 


QOverride 
public String toString() { 
return "[size=" + size + ", color=" + color + "]"; 


Spec 的 Set 为 : 


Set<Spec> Set = new 
set.add(new ee 'M" ed")); 
set.add(new Spec("M" red ) ) ， 
system.out ,printIn(set)， 


AS y 
输出 为 : 
[[size=M, color=red], [size=M, color=red]] 


同一 个 规格 输出 了 两 次 ， 为 避免 这 一 点 ， 需 要 为 Spec 重 写 
hashCode 和 equals 方 法 。 利 用 IDE 开 发 工具 往往 可 以 自动 生成 这 两 个 方 
法 ， 比 如 Eclipse 中 ， 可 以 通过 "Source"->"Generate hashCode () and 
equals () .…"， 我 们 吏 不 警 述 了 


HashSet 有 很 多 应 用 场景 ， 比 如 : 


1) 排 重 ， 如 有 果 对 排 重 后 的 元 素 没有 顺序 要 求 ， 则 HashSet 可 以 方 
便 地 用 于 排 重 ; 


2) 保存 特殊 值 ，Set 可 以 用 于 保存 各 种 特殊 值 ， 程 序 处 理 用 户 请 
求 或 数据 记录 时 ， 根 据 是 否 为 特殊 值 判断 是 否 进行 特殊 处 理 ， 比 如 保 
存 IP 地 址 的 墨 名 单 或 日 名 单 ; 


3) 集合 运算 ， 使 用 Set 可 以 方便 地 进行 数学 集合 中 的 运算 ， 如 交 
集 、 并 集 等 运算 ， 这 些 运算 有 一 些 很 现实 的 意义 。 比 如 ， 用 户 标签 计 
算 ， 每 个 用 户 都 有 一 些 标签 ， 两 个 用 户 的 标签 区 集束 表示 他 们 的 共同 
等 征 ， 交 集 大 小 除 以 并 集 大 小 可 以 表示 他 们 的 相似 程度 。 


10.2.2 ”实现 原理 


HashSet 内 部 是 用 HashMap 实 现 的 ， 它 内 部 有 一 个 HashMap 实 例 变 
量 ， 如 下 所 示 : 


private transient HashMap<E,0Object> map; 


我 们 知道 ，Map 有 键 和 值 ，HashSset 相 当 于 只 有 键 ， 值 都 是 相同 的 
固定 值 ， 这 个 值 的 定义 为 : 


private static final Object PRESENT = new Object(); 


理解 了 这 个 内 部 组 成 ， 它 的 实现 方法 也 束 比 较 容易 理解 了 ， 我 们 
来 看 下 代码 。 


0 主要 驶 是 调用 了 对 应 的 HashMap 的 构造 方 
法 ， 比 如 : 


public HashSet(int initialCapacity, float loadFactor) { 
map = new HashMap<>(initialCcapacity, loadFactor); 


接受 Collection 参 数 的 构造 方法 稍微 不 一 样 ， 代 码 为 ， 


public HashSet(Collection<? extends E> c) 
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16)); 
addAll(c); 


也 很 容易 理解 ，c.size () /.75f 用 于 计算 initialCapacity，0.75f 是 
loadFactor 的 默认 值 。 


我 们 看 add 方 法 的 代码 : 


public boolean add(E e) { 
return map.put(e, PRESENT)==null,; 


就 是 调用 map 的 put 方 法 ， 元 素 e 用 于 键 ， 值 就 是 固定 值 
PRESENT，put 返 回 null 表 示 原 来 没有 对 应 的 键 ， 添 加 成 功 了 。 
HashMap 中 一 个 键 只 会 保存 一 份 ， 所 以 重复 添加 HashMap 不 会 变化 。 


检查 是 否 包 含 元 隶 ， 代 码 为 : 


public boolean contains(Object 0) { 
return map.containskey(o); 


} 


就 是 检查 map 中 是 否 包 含 对 应 的 键 。 


删除 元 素 的 代码 为 : 


public boolean remove(Object 0) { 
return map.remove(o)==PRESENT; 


} 


就 是 调用 map 的 remove 方 法 ， 返 回 值 为 PRESENT 表 示 原 来 有 对 应 
的 键 且 删除 成 功 了 。 


迭代 闫 的 代码 为 : 


public Iterator<E> iterator() { 
return map.keySsSet().iterator(); 


} 
束 是 返回 map 的 keySet 的 迭代 器 。 


10.2.3 水 缚 


本 六 介绍 了 HashSet 的 用 法 和 实现 原理 ， 它 实现 了 了 Set 接口 ， 内 部 
实现 利用 了 HashMap， 有 如 下 特点 : 


1) 没有 重复 元 素 ; 


可 以 高 效 地 添加 、 删 除 元 素 、 判 断 元 素 是 否 存在 ， 效 率 都 为 O 
1) ; 


3) 没有 顺序 。 


HashSet 可 以 方便 高 效 地 实现 去 重 、 集 合 运算 等 功能 。 如 果 要 保持 
添加 的 顺序 ， 可 以 使 用 HashSset 的 一 个 子 类 LinkedHashSet。Set 不 有 一 
个 重要 的 实现 类 TreeSet， 它 可 以 排序 。 这 两 个 类 ， 我 们 在 后 续 小 节 介 


一 口 


10.3 排序 二 又 树 


HashMap 和 HashSet 的 共同 实现 机 制 是 哈 希 表 ， 一 个 共同 的 限制 是 
没有 顺序 ， 我 们 提 到 ， 它 们 都 有 一 个 能 保持 顺序 的 对 应 类 TreeMap 和 
TreeSet， 这 两 个 类 的 共同 实现 基础 是 排序 二 又 树 。 为 了 更 好 地 理解 
TreeMap 和 TreeSet， 本 节 先 介绍 排序 二 又 树 的 一 些 基本 概念 和 算法 。 


10.3.1 基本 概念 


先 来 说 树 的 概念 。 现 实 中 ， 树 是 从 下 往 上 长 的 ， 树 会 分 又 ， 在 计 
算 机 程序 中 ， 一 般 而 言 ， 与 现实 相反 ， 树 是 从 上 往 下 长 的 ， 也 会 分 
义 ; -有 有 个 人 恨 休 忆 各个 中 友 司 以 有 有 一 个 或 多 个 位 于 已 成 ， 讽 有 捞 了 于 
点 的 节点 一 般 称 为 叶子 节点 。 


二 叉 树 是 一 柠 树 ， 每 个 下 点 最 多 有 两 个 孩子 万 点 ， 一 左 一 右 ， 左 
边 的 称 为 左 孩子 ， 右 边 的 称 为 右 孩子 ， 示 例如 图 10-5 所 示 。 


图 10-5 中 ， 两 棵 树 都 是 二 又 树 ， 图 10-5 (a) 所 示 二 又 树 的 根 节 点 
为 5， 除 了 叶子 节点 外 ， 每 个 节点 都 有 两 个 孩子 点; 图 10-5 (b) 所 示 
二 义 树 的 根 世 点 为 ?， 有 的 节点 有 两 个 孩子 万 点 ， 有 的 只 有 一 个 。 树 有 
一 个 高 度 或 深度 的 概念 ， 是 从 根 到 叶子 节点 经 过 的 节点 个 数 的 最 大 
值 ， 左 边 树 的 高 度 为 9， 右 边 树 的 高 度 为 5。 


排序 二 又 树 也 是 二 又 树 ， 但 它 没有 重复 元 素 ， 而 且 是 有 序 的 二 又 
树 。 什 么 顺序 呢 ? 对 每 个 节点 而 言 : 

:如 果 左 子 树 不 为 空 ， 则 左 子 树 上 的 所 有 节点 都 小 于 该 节点 : 

:如果 右 子 树 不 为 空 ， 则 右 子 树 上 的 所 有 节点 都 大 于 该 节点 。 


图 10-5 中 的 两 棵 二 又 树 都 是 排序 二 又 树 。 比 如 左边 的 树 ， 根 节点 为 
5， 左 边 的 都 小 于 5， 右 边 的 都 大 于 5。 再 看 右边 的 树 ， 根 户 点 为 7， 左 
~ 右边 的 都 大 于 7， 在 以 3 为 根 的 左 子 树 中 ， 其 右 子 树 的 值 
3 。 
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图 10-5 ”二叉树 示例 
10.3.2” 基本 算法 


排序 二 又 树 有 什么 优点 ?如 何在 树 中 进行 基本 操作 〈 如 查找 、 明 
历 、 插 入 和 删除 ， 呢 ?我 们 来 看 一 下 基本 的 算法 。 


1 .查找 


排序 二 又 树 有 一 个 很 好 的 优点 ， 在 其 中 查找 一 个 元 素 时 很 方便 、 
也 很 高 效 ， 基 本 步骤 为 : 


1) 首先 与 根 节 点 比较 ， 如 果 相 同 ， 就 找到 了 ; 
2) 如 果 小 于 根 世 点 ， 则 到 左 子 树 中 递归 碍 找 ; 
3) 如 有 果 大 于 根 市 点 ， 则 到 右 子 树 中 递归 查找 。 
这 个 步 又 与 在 数组 中 进行 二 分 查找 的 思路 古 类 似 的 ， 如 琳 二 叉 树 


是 比较 平衡 的 ， 类 似 图 10-5 (a) 所 示 二 叉 树 ， 则 每 次 比较 都 能 将 比较 
范围 缩小 一 半 ， 效 率 很 高 。 


此 外 ， 在 排序 二 义 树 中 ， 可 以 方便 地 查找 最 小 值 和 最 大 值 。 最 小 
值 即 为 最 左边 的 订 点， 从 根 市 点 一 路 查找 左 孩 于 即 可 ;最 大 值 即 为 最 
右边 的 玉 点 ， 从 根 世 点 一 路 查找 右 孩 子 即 可 。 


2. 裔 历 


排序 二 又 树 也 可 以 方便 地 按 序 遍 历 。 用 递归 的 方式 ， 用 如 下 算法 
即 可 按 序 裔 历 : 


1) 访问 左 子 树 ; 

2) 访问 当前 节点 ; 

3) 访问 右 子 树 。 

比如 ， 遍 历 访问 图 10-6 所 示 的 二 又 树 。 

从 根 世 点 开始 ， 但 先 访 问 根 节点 的 左 子 树 ， 一 直到 最 左边 的 节 
点 ， 所 以 第 一 个 访问 的 是 1，1 没 有 右 子 树 ， 返 回 上 一 层 ， 访 问 3， 然 后 
访问 3 的 右 子 树 ，4 没 有 左 子 树 ， 所 以 访问 4， 然 后 是 4 的 右 子 树 6， 以 此 
类 推 ， 访问 顺序 就 是 有 序 的 : 1、3、4、6、7、8、9。 

不 用 递归 的 方式 ， 也 可 以 实现 按 序 过 历 ， 第 一 个 下 尽 为 最 元 这 的 
节点 ， 从 第 一 个 市 点 开始 ， 依 次 找 后 继 节 点 。 给 定 一 个 节点 ， 找 其 后 
显 季 沁 的 算 ; 去 为 : 

1) 如 果 该 节点 有 右 孩 子 ， 则 后 继 节点 为 右 子 树 中 最 小 的 节点 。 

2) 如 果 该 节点 没有 右 孩 子 ， 则 后 继 节 点 为 父 节 点 或 革 个 祖先 和 
点 ， 从 当前 节点 往 上 找 ， 如 果 它 是 父 节 点 的 右 孩 子 ， 则 继续 找 父 市 


点 ， 直 到 它 不 是 右 孩 子 或 父 节点 为 空 ， 第 一 个 非 右 孩子 节点 的 父 节点 
就 是 后 继 节 点 ， 如 果 梳 不 到 这 样 的 祖先 节点 ， 则 后 继 为 空 ， 汤 历 结 


文字 拉 述 比较 抽象 ， 我 们 来 看 个 图 ， 以 图 10-6 为 例 ， 每 个 太后 的 后 
继 节 点 如 图 10-7 浅 色 箭 头 所 示 。 


图 10-6 ”排序 二 叉 树 示例 
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图 10-7 ”排序 二 又 树 节 点 后 继 
对 每 个 节点 ， 对 照 算法 ， 我 们 再 详细 解释 下 : 


1) 第 一 个 斑点 1 没有 右 孩 子 ， 它 不 是 父 玉 点 的 右 孩 子 ， 所 以 它 的 
后 继 万 点 束 是 其 父 世 点 3; 


2) 3 有 右 孩 子 ， 右 子 树 中 最 小 的 就 是 4， 所 以 3 的 后 继 万 点 为 4; 


3) 4 有 右 孩 子 ， 右 子 树 中 只 有 一 个 节点 6， 所 以 4 的 后 继 节 点 为 6; 

4) 6 没有 石 孩 子 ， 往 上 找 父 节点 ， 它 是 父 节 点 4 的 右 孩 子 ，4 叉 是 
遇 局 3 的 右 孩 于 ， 3 不 是 父 下 点 7 的 右 孩 和子 ， 所 以 6 的 后 继 世 点 为 3 的 父 
7; 


父 


4 


5) 7 有 右 孩 子 ， 右 子 树 中 最 小 的 是 8， 所 以 7 的 后 继 世 点 为 8; 


6) 8 没有 右 孩 子 ， 往 上 找 父 斑点 ， 它 不 是 父 玫 点 9 的 右 孩 于 ， 所 以 
它 的 后 继 太 皮 束 是 其 父 节 后 9; 


7) 9 没有 右 孩 子 ， 往 上 找 父 玉 点 ， 它 是 父 忆 点 7 的 石 孩子 ， 接 着 往 
上 找 ,但 7 已 经 是 根 节 点 ， 父 市 反 为 室 ， 所 以 后 继 为 空 。 


, 卜 么 构建 排序 二 广 树 呢 ? 可 以 在 插入 、 删 除 元 取 的 过 程 中 形成 和 


村 
3. 插 入 


在 排序 二 叉 树 中 ， 插 入 元 素 首 先 要 找 插入 位 置 ， 即 新 证 点 的 父 市 
点 ， 怎 么 找 呢 ? 与 得 找 元 聚 类 似 ， 从 根 世 点 开始 往 下 找 ， 其 步骤 为 : 


1) 与 当前 节点 比较 ， 如 果 相 同 ， 表 示 已 经 存在 了 ， 不 能 再 插入 ; 


2) 如 来 小 于 当前 太 态 ， 则 到 左 子 树 中 寻找 ， 如 来 左 于 树 为 空 ， 则 
当前 节点 即 为 要 找 的 父 节 后 ; 

3) 如 果 大 于 当前 市 点 ， 则 到 右 子 树 中 寻找 ， 如 果 右 子 树 为 室 ， 则 
当前 市 点 即 为 要 找 的 父 节 后 。 


找到 父 厄 态 后 ， 即 可 插入 ， 如 末 插 入 元 素 小 于 父 太 感 ， 则 作为 左 
孩子 插入 ， 人 否则 作为 石 孩子 插入 。 我 们 来 看 个 例 了 于， 依次 插入 7、3、 
4、1、9、6、8 的 过 程 ， 这 个 过 程 如 图 10-8 所 示 。 
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图 10-8 排序 二 又 树 插 入 过 程 
4. 删 除 
从 排序 二 又 树 中 删除 一 个 节点 要 复杂 一 些 ， 有 三 种 情况 : 
广 点 为 叶子 节点 ; 


"A 
让 上 扩 有 了 两 个 护 子 玉 态 。 
我 们 分 别 介绍 。 


如 果 节点 为 叶子 节点 ， 则 很 简单 ， 可 以 直接 删 掉 ， 修 改 父 节 点 的 
对 应 孩子 节点 为 空 即 可 。 


如 有 打下 点 只 有 一 个 孩子 万 扎 ， 则 蔡 换 待 删节 点 为 孩子 万 所， 或 者 
说 ， 在 孩子 节点 和 父 玉 点 之 间 直 接 建 立 链接 。 比 如 ， 在 图 10-9 中 ， 左 边 
， 中 删除 节点 4， 就 是 让 4 的 父 节 点 3 与 4 的 孩子 节点 6 直 接 建立 链 
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图 10-9 “排序 二 又 树 删除 节点 ， 节 点 只 有 一 个 孩子 节点 的 情况 
如 果 节 点 有 两 个 孩子 节点 趾 ， 则 首先 找 该 节点 的 后 继 节点 ， 找 到 
后 继 节 点 后 ， 赫 换 待 删节 点 为 后 继 节点 的 内 容 ， 然 后 再 删除 后 继 节 
点 。 后 继 节点 没有 左 孩 子 ， 这 就 将 两 个 孩子 节点 的 情况 转换 为 了 叶子 
节点 或 只 有 一 个 孩子 节点 的 情况 。 比 如 ， 在 图 10-10 中 ， 从 左边 二 又 树 
中 删除 节点 3，3 有 两 个 孩子 节点 ， 后 继 节点 为 4， 首 先 蔡 换 3 的 内 容 为 
4， 


然后 再 删除 节点 4。 
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图 10-10 排序 二 叉 树 删除 节点 : 节点 有 两 个 孩子 节点 的 情况 


10.3.3 “平衡 的 排序 二 又 树 


从 前 面 的 描述 中 可 以 看 出 ， 排 序 二 又 树 的 形状 与 插入 和 删除 的 顺 
序 密切 相关 ， 极 端 情况 下 ， 排 序 二 叉 树 可 能 退化 为 一 个 链表 。 比 如 ， 


如 果 插 入 顺序 为 1、3、4、6、7、8、9， 则 排序 二 又 树 如 图 10-11 所 示 。 


图 10-11 退化 的 排序 二 又 树 


退化 为 链表 后 ， 排 序 二 叉 树 的 优点 就 都 没有 了 ， 即 使 没有 退化 为 
链表 ， 如 有 果 排 序 二 又 树 高 度 不 平衡 ， 效 率 也 会 变 得 很 低 。 


平衡 具体 定义 是 什么 呢 ? 有 一 种 高 度 平衡 的 定义 ， 即 任何 节点 的 
左右 子 树 的 高 度 差 最 多 为 一 。 满 足 这 个 平衡 定义 的 排序 二 又 树 又 被 称 
为 AVL 树 ， 这 个 名 字源 于 它 的 发 明 者 G.M.Adelson-Velsky 和 
E.M.Landis。 在 他 们 的 算法 中 ， 在 插入 和 删除 节点 时 ， 通 过 一 次 或 多 次 
旋转 操作 来 重新 平衡 树 。 


在 TreeMap 的 实现 中 ， 用 的 并 不 是 AVL 树 ， 而 是 红 黑 树 ， 与 AVIL 树 
类 似 ， 红 黑 树 也 是 一 种 平衡 的 排序 二 又 树 ， 也 是 在 插入 和 删除 节点 时 
通过 旋转 操作 来 平衡 的 ， 但 它 并 不 是 高 度 平衡 的 ， 而 是 大 人 致 平衡 的 。 
所 谓 大 致 是 指 ， 它 确保 任意 一 条 从 根 到 叶子 节点 的 路 径 ， 没 有 任何 一 
条 路 径 的 长 度 会 比 其 他 路 径 长 过 两 倍 。 红 黑 树 减弱 了 对 平衡 的 要 求 ， 

了 保持 平衡 需要 的 开销 ， 在 实际 应 用 中 ， 统 计 性 能 高 于 AVL 
对 。 


为 什么 叫 红 车 树 呢 ? 因 为 它 对 每 个 节点 进行 大 色 ， 闫 色 或 黑 或 
红 ， 并 对 市 点 的 着 色 有 一 些 约束 ， 满 足 这 个 约束 即 可 以 确保 树 古 大 致 


平衡 的 。 


对 AVL 树 和 红 臣 树 ， 它 们 保持 平衡 的 细 市 都 是 比较 复杂 的 ， 我 们 
就 不 介绍 了 ， 需 要 知道 的 是 ， 它 们 都 是 排序 二 文 树 ， 都 通过 在 插入 和 
删除 时 执行 开销 不 大 的 旋转 操作 保持 了 树 的 高 度 平 衡 或 大 致 平衡 ， 从 
而 保证 了 树 的 查找 效率 。 


10.34 站 结 


本 小 节 介 绍 了 排序 二 又 树 的 基本 概念 和 算法 。 


排序 二 又 树 保 持 了 元 素 的 顺序 ， 而 且 是 一 种 综合 效率 很 高 的 数据 
结构 ， 基 本 的 保存 、 删 除 、 查 找 的 效率 都 为 0 \h) ，h 为 树 的 高 度 。 在 
树 平衡 的 情况 下 ，h 为 log。 (N) ，N 为 点 数 。 比 如 ， 如 果 N 为 1024， 
则 log。 (N) 为 10。 


基本 的 排序 二 又 树 不 能 保证 树 的 平衡 ， 可 能 退化 为 一 个 链表 。 有 
很 多 保持 树 平衡 的 算法 ，AVL 树 能 保证 树 的 高 度 平衡 ， 但 红 墨 树 是 实 
际 中 使 用 更 为 广泛 的 ， 虽 然 红 墨 树 只 能 保证 大 致 乎 衡 ， 但 降低 了 维持 
树 平衡 需要 的 开销 ， 整 体 统计 效果 更 好 。 


与 蛤 希 表 一 样 ， 树 也 是 计算 机 程序 中 一 种 重要 的 数据 结构 和 思维 
方式 。 为 了 能 够 快速 操作 数据 ， 哈 布 和 树 是 两 种 基本 的 思维 方式 ， 不 
需要 顺序 ， 优 先 考 虑 哈 希 ， 和 需要 顺序 ， 考 虑 树 。 除 了 容器 类 
TreeMap/TreeSet， 数 据 库 中 的 索引 结构 也 是 基于 树 的 (不 过 基于 B 树 ， 
而 不 是 二 义 树 ) ， 而 索引 是 能 够 在 大 量 数 据 中 快速 访问 数据 的 关键 。 


理解 了 排序 二 叉 树 的 基本 概念 和 算法 ， 理 解 TreeMap 和 TreeSet 束 比 
较 容 易 了 ， 证 我 们 在 接 下 来 的 小 站 中 探讨 这 两 个 类 。 


[1] 根据 之 前 介绍 的 后 继 算 法 ， 后 继 市 点 为 右 于 树 中 最 小 的 市 点 ， 这 个 
后 继 让 点 一 定 没 有 左 孩 子 玉 点 。 


10.4 剖析 TreeMap 


在 介绍 HashMap 时 ， 我 们 提 到 ，HashMap 有 一 个 重要 局 限 ， 键 值 
对 之 间 没 有 竺 定 的 顺序 ， 我 们 还 提 到 ，Map 接 口 有 另 一 个 重要 的 实现 
类 TreeMap， 在 TreeMap 中 ， 键 值 对 之 间 按 键 有 序 ，TreeMap 的 实现 基 
础 是 排序 二 文 树 ，10.3 市 介绍 了 排序 二 义 树 的 基本 概念 和 算法 ， 本 市 
我 们 来 详细 讨论 TreeMap。 除 了 Map 接 口 ， 因 为 有 序 ，TreeMap 还 实现 
法 。 下 面 ， 我 们 先 来 介绍 TreeMap 的 用 法 ， 然 后 介绍 
其 内 部 实现 。 


10.4.1 基本 用 法 
TreeMap 有 两 个 基本 构造 方法 : 


public TreeMap() 
public TreeMap(Comparator<? super K> comparator) 


第 一 个 为 默认 构造 方法 ， 如 果 使 用 默认 构造 方法 ， 要 求 Map 中 的 
键 实现 Comparabe 接 口 ，TreeMap 内 部 进行 各 种 比较 时 会 调用 键 的 
Comparable 接 口中 的 compareTo 方 法 。 


第 二 个 接受 一 个 比较 器 对 象 comparator， 如 果 comparator 不 为 
null， 在 TreeMap 内 部 进行 比较 时 会 调用 这 个 comparator 的 compare 方 
法 ， 而 不 再 调用 键 的 compareTo 方 法 ， 也 不 再 要 求 键 实现 Comparable 接 
本 二 


应 该 用 哪 一 个 呢 ? 第 一 个 更 为 简单 ， 但 要 求 键 实 现 Comparable 接 
口 ， 且 期 在 的 排序 和 键 的 比较 结 采 是 一 致 的 ; 第 二 个 更 为 灵活 ， 不 要 
求 键 实现 Comparable 接 口 ， 比 较 器 可 以 用 灵活 复 洒 的 方式 进行 实现 。 


需要 强调 的 是 ，TreeMap 是 按键 而 不 是 按 值 有 序 ， 无 论 哪 一 种 ， 
都 是 对 键 而 非 值 进行 比较 。 


看 段 商 单 的 示例 代码 : 


Map<String，String> map = new TreeMap<>(); 

map.put("a", "abstract"); 

map.put("c", "call"); 

map.put("b", "basic"); 

map.put("T", "tree"); 

for(Entry<String,String> kv : map.entrySet()){ 
System,.out.print(kv.getkey()+"="+kv.getValue()+" "); 

} 


创建 了 一 个 TreeMap， 但 只 是 当 作 Map 使 用 ， 不 过 达 代 时 ， 其 输出 
却 征 按键 排序 的 ， 输 出 为 : 


T=tree a=abstract b=basic c=call 


T 排 在 最 前 面 ， 是 因为 大 写字 母 的 ASCII 码 都 小 于 小 写字 母 。 如 果 
名望 忽略 大 小 写 呢 ?可 以 传递 一 个 比较 器 ，String 类 有 一 个 静态 成 员 
CASE_INSENSITIVE_ORDER， 写 了 驶 是 一 个 忽略 大 小 写 的 Comparator 
对 象 ， 替 换 第 一 行 代码 为 : 


Map<String, String> map = new TreeMap<>(String.CASE_INSENSITIVE_ORDER ) ， 
2 [上 庆 放 人 ZR> 
输出 殉 会 变 为 : 

a=abstract b=basic c=call T=tree 


正常 排序 是 从 小 到 大 ， 如 果 和 希望 逆序 昵 ? 可 以 传递 一 个 不 同 的 
Comparator 对 象 ， 第 一 行 代码 可 以 替换 为 ; 


Map<String, String> map = new TreeMap<>(new Comparator<String>(){ 
QOverride 
public int compare(String o1, String 02) { 
return o2.compareTo(o1); 


}); 
这 样 ， 输 出 会 变 为 : 


c=call b=basic a=abstract T=tree 


为 什么 这 样 就 可 以 逆序 呢 ? 正 常 排序 中 ，compare 方 法 内 是 
ol.compareTo (02) ， 两 个 对 象 翻 过 来 ， 自 然 就 是 逆序 了 ，Collections 
类 有 一 个 静态 方法 reverseOrder () 可 以 返回 一 个 逆序 比较 器 ， 也 就 是 
说 ， 上 面 的 代码 也 可 以 蔡 换 为 : 


Map<String, String> map = new TreeMap<>(Collections.reverseOrder()); 


如 采 布 望 逆序 且 忽 略 大 小 写 呢 ? 第 一 行 可 以 车 换 为 : 


Map<String，String> map = new TreeMap<>( 
Collections,reverseorder(String.CASE_INSENSITIVE_ORDER ) ) ， 


需要 说 明 的 是 ，TreeMap 使 用 键 的 比较 结果 对 键 进行 排 重 ， 即 使 
键 实际 上 不 同 ， 但 只 要 比较 结 末 相同 ， 它 们 就 会 被 认 为 相同 ， 链 只 会 
保存 一 份 。 比如， 如 下 代码 : 


Map<String, String> map = new TreeMap<>(String.CASE_ INSENSITIVE ORDER); 

map.put("T", "tree"); 

map.put("t", "try"); 

for(Entry<String,String> kv : map.entrySet()){ 
System.out.print(kv.getkey()+"="+kv.getValue()+" "); 

} 


看 上 去 有 两 个 不 同 的 键 "T" 和 "tr"， 但 因为 比较 器 忽略 大 小 写 ， 所 以 


凡人 
T=try 


键 为 第 一 次 put 时 的 ， 这 里 即 "T"， 而 值 为 最 后 一 次 put 时 的 ， 这 里 
Bj"try" ° 


我 们 再 来 看 一 个 例子 ， 刍 为 子 符 串 形 式 的 日 期 ， 值 为 一 个 统计 数 
字 ， 布 望 按照 日 期 输出 ， 代 码 为 : 


Map<String, Integer> map = new TreeMap<>(); 
map.put("2016-7-3", 100); 
map.put("2016-7-10", 120); 
map.put("2016-8-1", 90); 


for(Entry<String, Integer> kv : map.entrySet()){ 
System.out.println(kv.getkey()+","+kv.getValue()); 
} 


输出 为 : 


2016-7-10,120 
2016-7-3,100 
2016-8-1,90 


7 月 10 号 的 排 在 了 7 月 3 号 的 前 面 ， 与 期 望 的 不 符 ， 这 是 因为 ， 它 们 
是 按照 字符 串 比 较 的 ， 按 字符 串 ，2016-7-10 就 是 小 于 2016-7-3， 因 为 
二 7 八国 之 N12 于 


择 么 解决 呢 ? 可 以 使 用 一 个 目 定义 的 比较 右 ， 将 字符 串 转 换 为 日 
期 ， 按 日 期 进行 比较 ， 第 一 行 代 码 可 以 改 为 : 


Map<String, Integer> map = new TreeMap<>(new Comparator<String>() { 
SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd"); 
QOverride 
public int compare(String o1, String 02) { 

try { 


return sdf.parse(o1).compareTo(sdf.parse(o2)); 
} catch (ParseException e) { 

e.printStackTrace( ); 

return ©; 


} 
}); 


这 样 ， 输 出 束 符 合 期 望 了 ， 会 变 为 : 


2016-7-3,100 
2016-7-10,120 
2016-8-1,90 


以 上 束 是 TreeMap 的 基本 用 法 ， 与 HashMap 相 比 : 相同 的 是 ， 它 们 
都 实现 了 Map 接 口 ， 都 可 以 按 Map 进 行 操 作 。 不 同 的 是 ， 迭 代 时 ， 
TreeMap 按 键 有 序 ， 为 了 实现 有 序 ， 它 要 求 要 么 键 实 现 Comparable 接 
口 ， 要 么 创建 TreeMap 时 传递 一 个 Comparator 对 象 。 


由 于 TreeMap 按 键 有 序 ， 它 还 文 持 更 多 接口 和 方法 ， 有 具体 来 说 ， 
它 还 实现 了 Sorted-Map 和 NavigableMap 接 口 ， 而 NavigableMap 接 口 扩 
展 了 SortedMap， 通 过 这 两 个 接口 ， 可 以 方便 地 根据 键 的 顺序 进行 得 
找 ， 如 第 一 个 、 最 后 一 个 、 某 一 范围 的 键 、 邻 近 键 等 ， 限 于 篇 幅 ， 我 
们 就 不 介绍 了 ， 具 体 可 参见 API 文 档 。 


10.4.2 ”实现 原理 


TreeMap 内 部 是 用 红 黑 树 实现 的 ， 红 黑 树 是 一 种 大 致 平衡 的 排序 
二 叉 树 ，10.3 节 我 们 介绍 了 排序 二 又 树 的 基本 概念 和 算法 ， 本 节 主 要 
看 TreeMap 的 一 些 代码 实现 (基于 Java 7) ， 先 来 看 TreeMap 的 内 部 组 


1. 内 部 组 成 
TreeMap 内 部 主要 有 如 下 成 员 : 


private final Comparator<? super K> comparator ， 
private transient Entry<K,V> root = null; 
private transient int size = 0; 


comparator 束 是 比较 器 ， 在 构造 方法 中 传递 ， 如 果 没 传 ， 束 是 
null 。size 为 当前 键 值 对 个 数 。root 指 癌 树 的 根 广 点 ， 从 根 市 点 可 以 访 
问 到 每 个 和 点 ， 克 点 的 类 型 为 Entry。Entry 是 TreeMap 的 一 个 内 部 类 ， 
其 内 部 成 员 和 构造 方法 为 : 


static final class Entry<K,V> implements Map.Entry<K,V> { 

K Key， 

V value; 

Entry<K,V> left = null; 

Entry<K,V> right = null; 

Entry<K,V> parent,; 

boolean color = BLACK; 

Entry(K key, V value, Entry<K,V> parent) { 
this.key = key; 
this.value = value,; 
this.parent = parent,; 


每 个 节点 除了 键 (key) 和 值 (value) 之 外 ， 还 有 三 个 引用 ， 分 
别 指向 其 左 孩 子 (left) 、 右 孩子 (right) 和 父 节 点 (parent) ， 对 于 
根 廊 点 ， 父 节点 为 null， 对 于 叶子 节点 ， 孩 子 广 点 都 为 null， 还 有 一 个 
成 员 color 表 示 颜 色 ，TreeMap 是 用 红 黑 树 实 现 的 ， 每 个 和 点 都 有 一 个 
颜色 ， 非 黑 即 红 。 


了 解 了 TreeMap 的 内 部 组 成 ， 我 们 来 看 一 些 主要 方法 的 实现 代 


2. 保 存 键 值 对 


put 方 法 的 代码 稍微 有 点 长 ， 我 们 分 段 来 看 。 先 看 第 一 段 ， 添 加 第 
一 个 市 点 的 情况 : 


public V put(K key, V value) { 
Entry<K,V> t = root; 
if(t == null) { 
compare(key, key); // type (and possibly null) check 
root = new Entry<>(key, value, null); 


size = 1; 
modCount++; 
return null; 
} 
//.. 


2 root 为 null， 执 行 的 就 是 这 段 代 码 ， 主 要 就 
是 新 建 一 个 节点 ， 设 置 root 指 问 它 ，size 设 置 为 1，modCountt++ 的 含义 
ee 用 于 迭代 过 程 中 检测 结构 性 变化 。 


令 人 费解 的 是 compare 调 用 ，compare (key, key) ; ，key 与 key 
比 ， 有 什么 意义 呢 ? 我 们 看 compare 方 法 的 代码 : 


final int compare(Object ki1i, Object k2) { 
return comparator==null ? ((Comparable<? super K>)k1).compareTo((K)k2) 
: comparator.compare((K)k1, (K)k2); 
} 


其 实 ， 这 里 的 目的 不 是 为 了 比较 ， 而 是 为 了 检查 key 的 类 型 和 
null， 如 果 类 型 不 匹配 或 为 null， 那 么 compare 方 法 会 抛 出 异常 。 


如 果 不 是 第 一 次 添加 ， 会 执行 后 面 的 代码 ， 添 加 的 关键 步骤 是 寻 
找 父 忆 点 。 寻 找 父 世 点 根据 是 否 设置 了 comparator 分 为 两 种 情况 ， 我 
们 先 来 看 已 设置 的 情况 ， 代 码 为 : 


int cmp; 
Entry<K,V> parent,; 
//split comparator and comparable paths 
Comparator<? Super K> cpr = comparator ， 
if(cpr != null) { 
do { 
parent = 七 
cmp = cpr.compare(key, t.key); 


else if(cmp > 0) 
t = t.right; 
else 
return t.setValue(value); 
} while (t != null); 


寻找 是 一 个 从 根 节 点 开始 循环 的 过 程 ， 在 循环 中 ，cmp 保 存 比 较 
结果 ，t 指 回 当 前 比较 和 点 ，parent 为 t 的 父 世 点， 循环 结束 后 parent 就 
是 要 找 的 父 节点 。t 一 开始 指 同 根 节 点 ， 从 根 太 点 开始 比较 键 ， 如 果 小 
于 根 世 点 ， 就 将 t 设 为 左 孩 和子， 与 左 孩 子 比 较 ， 大 于 怠 与 右 孩 子 比较 ， 
就 这 样 一 直 比 ， 直 到 t 为 null 或 比较 结果 为 0°。 如 果 比 较 结 果 为 0， 表 示 
已 经 有 这 个 键 了 ， 设 置 值 ， 然 后 返回 。 如 果 t 为 nul， 则 当 退 出 循环 
时 ，parent 就 指 回 竺 插入 节点 的 父 届 点 。 


我 们 再 来 看 没有 设置 comparator 的 情况 ， 代 码 为 : 


else { 
if(key == null) 
throw new NullPpointerException(); 
Comparable<? Super K> k = (Comparable<? Super K>) key; 
do { 
parent = 七， 
cmp = k.compareTo(t.key); 
if(cmp < 0) 
t = t.left,; 
else if(cmp > 0) 
t = t.right; 
else 
return t,SetValue(value ) ， 
} while(t != nul1)， 


基本 逻辑 是 一 样 的 ， 当 退出 循环 时 parent 指 向 父 节 点 ， 只 是 如 果 没 
有 设置 comparator， 则 假设 key 一 定 实现 了 Comparabje 沁 口 ， 使 用 
Comparable 接 口 的 compareTo 方 法 进行 比较 。 


找到 父 市 点 后 ， 就 是 狐 建 一 个 太 点 ， 根 据 狐 的 键 与 父 市 点 键 的 比 
9 结果 ， 插入 作为 左 左 孩 子 或 右 孩 子 ， 并 增加 size 和 modCount， 代 码 如 


Entry<K,V> e = new Entry<>(key, value, parent); 
if(cmp < 0) 
parent ,left = e; 
else 
parent.right = e; 
fixAfterIinsertion(e); 
SIZe++， 
modCount++， 


代码 大 部 分 都 容易 理解 ， 不 过 ， 里 面 有 一 行 重要 调用 
fixAfterInsertion (e) ; ， 它 就 是 在 调整 树 的 结构 ， 使 之 符合 红 黑 树 的 
约束 ， 保 持 大 致 平衡 ， 其 代码 我 们 束 不 介绍 了 。 


稍微 总 结 一 下 ， 其 基本 思路 束 定 : 循环 比较 找到 父 点 ， 并 插入 
作为 其 左 孩 子 或 右 孩子 ， 然 后 调整 保持 树 的 大 致 平衡 。 


3. 根 据 键 获取 值 
根据 键 获 取 值 的 代码 为 : 


public V get(Object key) { 
Entry<K,V> p = getEntry(key); 
return(p==null] ? null : p.value); 


} 


就 是 根据 key 找 对 应 节点 p， 找 到 市 点 后 获取 值 p.value， 来 看 
getEntry 的 代码 : 


final Entry<K,V> getEntry(Object key) { 
// Offload comparator-based version for sake of performance 
if(comparator != null) 
return getEntryUsingComparator (key); 
if(key == null) 
throw new NullPpointerException(); 


Comparable<? Super K> k = (Comparable<? Super K>) key 
Entry<K,V> p = root,; 
while(p != null) { 
int cmp = k.compareTo(p.key); 
if(cmp < 0) 
p = p.left,; 
else if(cmp > 0) 
p = p.right; 
else 
return p; 


return null; 


如 果 comparator 不 为 空 ， 调 用 单独 的 方法 
getEntryUsingComparator， 人 否则 ， 假 定 key 实 现 了 Comparable 接 口 ， 使 
用 接口 的 compareTo 方 法 进行 比较 ， 找 的 逻辑 也 很 测 单 ， 从 根 开 始 找 ， 
小 于 往 左 边 找 ， 大 于 往 右边 找 ， 直 到 找到 为 止 ， 如 果 没 找到 ， 返 回 
nul。getEntry-UsingComparator 方 法 的 逻辑 类 似 ， 束 不 性 述 了 。 


4. 查 看 是 否 包含 某 个 值 


TreeMap 可 以 高 效 地 按键 进行 查找 ， 但 如 果 要 根据 值 进行 查找 ， 
则 需要 遍历 ， 我 们 来 看 代 碍 : 


public boolean containsValue(Object value) { 
for(Entry<K,V> e = getFirstEntry(); e != null; e = successor(e)) 
if(valEquals(value, e.value)) 
return true; 
return false,; 


} 


主体 就 a 裔 历 ，getFirstEntry 方 法 返回 第 一 个 节点 ， 
successor 方 法 返回 给 定 和 点 的 后 继 节 点 ，valEquals 就 是 比较 值 ， 从 第 
一 个 万 点 开始 ， 逐个 进行 比较 直到 找到 为 止 ， 如 果 循 环 结束 也 没 找 
到 则 返回 false。getFirstEntry 的 代码 为 : 


final Entry<K,V> getFirstEntry() { 
Entry<K,V> p = root; 
if(p != null) 
while (p.left != null) 
p = p.1left,; 
return p; 


} 


代码 很 简单 ， 第 一 个 世上 点 就 是 最 左边 的 节点 。 
10.3 克 我 们 介绍 过 找 后 继 节 点 的 算法 ，successor 的 具体 代码 为 : 


static <K,V> TreeMap ,Entry<K,V> successor(Entry<K,V> t) { 
if(t == null) 
return null; 
else if(t.right != null) { 
Entry<K,V> p = t.right,; 
while (p.left != null) 
p = p.left,; 
return p; 
} else { 
Entry<K,V> p = t.parent; 
Entry<K,V> ch = tt; 
while(p != null && ch == p.right) { 
ch = p; 
p = p.parent,; 


return p; 


如 10.3 广 后 继 算 法 所 述 ， 有 两 种 情况 : 


本 
可 [局 5? 


2) 如 果 没 有 右 孩 子 ， 后 继 和 点 为 某 祖先 节点 ， 从 当前 世上 点 往 上 
找 ， 如 琳 它 是 父 节点 的 右 孩 子 ， 则 继 纺 索 找 父 节 点 ， 直 到 它 不 是 右 孩子 
或 父 节 点 为 空 ， 第 一 个 非 右 孩子 节点 的 父亲 节点 就 是 后 继 节 点 ， 如 果 
父 节 点 为 空 ， 则 后 继 节 点 为 null 。 


代码 与 算法 是 对 应 的 ， 束 不 再 资 述 了 ， 这 个 描述 比较 抽象 ， 可 以 
参考 图 10-7， 进 行 对 照 。 


5. 根 据 键 删除 键 值 对 
根据 链 了 删除 键 值 对 的 代码 为 : 


一 


public V remove(Object key) { 
Entry<K,V> p = getEntry(key); 
if(p == null) 
return null; 
V oldValue = p.value,; 
deleteEntry(p)， 


return oldValue; 


} 


根据 key 找 到 下 性 点 ， 调 用 deleteEntry 删 除 和 点， 然后 返回 原来 的 


10.3 攻 介绍 过 下 点 删除 的 算法 ， 克 点 有 三 种 情况 : 


1) 叶子 节点 : 这 个 容易 处 理 ， 直 接 修改 父 忆 点 对 应 引用 置 null 即 
pi o 


2) 只 有 一 个 孩子 ， 就 是 在 父 杀 节点 和 孩子 节点 直接 建立 链接 。 


3) 有 了 两 个 孩子 ， 先 找到 后 继 节 点 ， 找 到 后 ， 莅 换 当前 市 点 的 内 容 
为 后 继 节 点 ， 然 后 再 删除 后 继 节 点 ， 因 为 这 个 后 继 节点 一 定 没有 左 孩 
子 ， 所 以 束 将 两 个 孩子 的 情况 转换 为 了 前 前 午 两 各 博 况 。 


deleteEntry 的 具体 代码 也 稍微 有 点 长 ， 我 们 分 段 来 看 : 


private void deleteEntry(Entry<K,V> p) { 
modCount++; 
Size--,; 
//If strictly internal, copy successor's element to p and then make p 
//point to successor. 
if(p.left != null && p.right != null) { 
Entry<K,V> s = successor(p); 
p.key = s.key; 
p.value = s.value; 
p = s; 
} //p has 2 children 


这 里 处 理 的 束 是 两 个 孩子 的 情况 ，s 为 后 继 ， 当 前 市 点 p 的 key 和 
value 设 置 为 了 s 的 key 和 value， 然 后 将 竺 删 和 点 p 指 向 了 s， 这 样 丈 转换 
为 了 一 个 孩子 或 叶子 世上 点 的 情况 。 


再 往 下 看 一 个 孩子 情况 的 代码 : 


//Start fixup at replacement node, if it exists. 
Entry<K,V> replacement = (p.left != null ? p.left : p.right); 
if(replacement != null) { 

//Link replacement to parent 

replacement.parent = p.parent,; 

if(p.parent == null) 


root = replacement,; 
else if(p == p.parent.1left) 
p.parent.left = replacement,; 
else 
p.parent.right = replacement,; 
// Null out links so they are OK to use by fixAfterDeletion. 
p.left = p.right = p.parent = null,; 
// Fix replacement 
if(p.color == BLACK) 
fixAfterDeletion(replacement); 
} else if (p.parent == null) { // return if we are the only node. 


p 为 个 村 删节 点 ，replacement 为 要 替换 p 的 孩子 站点 ， 主 体 代 人 码 就 是 
在 p 的 父 节 点 p.parent 和 replacement 之 间 建 立 链接 ， 以 替换 p.parent 和 p 原 
来 的 链接 ， 如 果 p.parent 为 null， 则 修改 root 以 指向 新 的 根 。 
fixAfterDeletion 重 新 平衡 树 。 


最 后 来 看 叶子 市 护 的 情况 : 


} else if(p.parent == null) { // return if we are the only node. 
root = null; 
} else { // No children. Use self as phantom replacement and unlink. 
if(p.color == BLACK) 
fixAfterDeletion(p); 
if(p.parent != null) { 
if(p == p.parent.1eft) 
p.parent .left = null,; 
else if(p == p.parent.right) 
p.parent.right = null; 
p.parent = null; 


再 其 L 体 分 为 两 种 情况 : i 删除 最 后 一 个 节点 ， 修 改 root 为 
null; 男 一 种 是 根据 待 删节 点 是 父 广 点 的 左 孩 子 还 是 右 护 子 ， 相 应 的 
设置 孩子 节点 为 null。 


以 上 就 是 TresMap 的 基本 实现 原 永 理 ， 与 10.3 区 介绍 的 排序 二 又 树 的 
基本 概念 和 算法 是 一 人 致 的 ， 只 是 TreeMap 用 了 红 黑 树 。 


104.3 示 结 


本 贡 介 绍 了 TreeMap 的 用 法 和 实现 原理 ， 与 HashMap 相 比 ， 
TreeMap 同 样 实现 了 Map 接 口 ， 但 内 部 使 用 红 黑 树 实现 。 红 黑 树 是 统计 


效率 比较 高 的 大 致 平衡 的 排序 二 又 树 ， 这 决定 了 它 有 如 下 特点 : 


1) 按键 有 序 ，TreeMap 同 样 实现 了 SortedMap 和 NavigableMap 接 
口 ， 可 以 方便 地 根据 键 的 顺序 进行 查找 ， 如 第 一 个 、 最 后 一 个 、 某 一 
苑 围 的 键 、 邻 近 键 等 。 


2) 为 了 按键 有 序 ，TreeMap 要 求 键 实 现 Comparable 接 口 或 通过 构 
造 方法 提供 一 个 Com-parator 对 象 。 


3) 根据 键 保存 、 查 找 、 删 除 的 效率 比较 高 ， 为 O (h) ，h 为 树 的 
高 度 ， 在 树 平衡 的 情况 下 ，h 为 log。 (N) ，N 为 世 点 数 。 


应 该 用 HashMap 还 是 TreeMap 呢 ? 不 要 求 排序 ， 优 先 考虑 
HashMap， 要 求 排 序 ， 考 虑 TreeMap“。HashMap 有 对 应 的 TreeMap， 
HashSet 也 有 对 应 的 TreeSet， 下 下， 我 们 来 看 TreeSet 。 


10.5 剖析 TreeSet 


在 介绍 HashSset 时 ， 我 们 提 到 ，HashSet 有 一 个 重要 局 限 ， 元 素 之 
间 没 有 特定 的 顺序 ， 我 们 还 提 到 ，Set 接 口 还 有 另 一 个 重要 的 实现 类 
TreeSet， 它 是 有 序 的 ， 与 HashSet 和 HashMap 的 关系 一 样 ，TreeSet 是 基 
于 TreeMap 的 ， 本 蔬 我 们 来 详细 讨论 TreeSet。 下 面 ， 我 们 先 介绍 
TreeSet 的 用 法 ， 然 后 介绍 实现 原理 ， 最 后 总 结 分 析 TreeSet 的 特点 。 


10.5.1 基本 用 法 


TreeSet 的 基本 构造 方法 有 两 个 : 


public TreeSet( ) 
public TreeSet(Comparator<? super E> comparator) 


第 一 个 是 默认 构造 方法 ， 假 定 元 素 实 现 了 Comparable 接 口 ， 第 二 
个 使 用 传 入 的 比较 器 ， 不 要 求 元 素 实现 Comparable。TreeSet 经 常 也 只 
是 当 作 Set 使 用 ， 只 是 希望 迭代 输出 有 序 ， 如 下 面 代 码 所 示 : 


Set<String> words = new TreeSet<String>(); 

words.addAll(Arrays.asList(new String[]{ 
"tree", "map", "hash", "map", 
/ 

for(String w : words){ 
System,.out.print(w+" "); 


} 
输出 为 : 
hash map tree 


TreeSet 实 现 了 两 点 : 排 重 和 有 序 。 如 采 布 望 不 同 的 排序 ， 可 以 传 


递 一 个 Comparator， 比 如 ;: 


Set<String> words = new TreeSet<String>(new Comparator<String>(){ 
Q@override 
public int compare(String o1, String 02) { 
return o1.compareToIgnoreCase(o2); 


}}); 

words.addAll(Arrays.asList(new String[]{ 
"tree", "map", "hash", "Map", 

})); 


System.out.println(words); 


忽略 大 小 写 进行 比较 ， 输 出 为 : 


[hash, map, treel] 


需要 注意 的 是 ，Set 是 排 重 的 ， 排 重 是 基于 比较 结果 的 ， 结 果 为 0 
dl Wh ， 但 比较 结果 为 0， 所 以 只 会 保 
留 第 一 个 元 素 * 


以 上 就 是 TreeSet 的 基本 用 法 ， 简 单 易 用 。 因 为 有 序 ，TreeSet 还 实 
NavigableSetj) | 展 了 SortedSet， 可 
以 方便 地 根据 顺序 进行 查找 和 操作 ， 如 第 一 个 、 最 后 一 个 、 某 一 取 值 
范围 、 某 一 值 的 邻近 元 素 等 ， 限 于 篇 幅 ， 我 们 就 不 介绍 了 了 人， 具体 可 参 
见 API 文 档 。 


10.5.2 ”实现 原理 


之 前 章节 介绍 过 ，HashSet 是 基于 HashMap 实 现 的 ， 元 素 承 是 
HashMap 中 的 键 ， 值 是 一 个 固定 的 值 ，TreeSet 是 类 似 的 ， 它 是 基于 
TreeMap 实 现 的 。 我 们 具体 来 看 一 下 代码 ， 先 看 其 内 部 组 成 。 


TreeSet 的 内 部 有 如 下 成 员 : 


private transient NavigableMap<E,Object> m; 
private static final Object PRESENT = new Object(); 


mm 就 是 背后 的 那个 TreeMap， 这 里 用 的 是 更 为 通用 的 接口 类 型 
NavigableMap，PRESENT 就 古 那 个 固定 的 共享 值 。TreeSet 的 方法 实现 
主要 殉 是 调用 mm 的 方法 ， 我 们 具体 来 看 下 。 


默认 构造 方法 的 代码 为 : 


TreeSet(NavigableMap<E,Object> m) { 
this.m = m; 


} 
public TreeSet() { 
this(new TreeMap<E, Object>()); 


代码 部 比较 简单 ， 谍 不 解释 了 。 添 加 元 素 ，add 方 法 的 代码 为 : 


public boolean add(E e) { 
return m.put(e, PRESENT)==null]; 
} 


就 是 调用 map 的 put 方 法 ， 元 素 e 用 作 键 ， 值 就 是 固定 值 
PRESENT，put 返 回 null 表 示 原 来 没有 对 应 的 键 ， 添 加 成 功 了 。 检 查 是 
否 包含 元 素 ， 代 码 为 : 


public boolean contains(Object o) { 
return m.containskKey(o); 


就 是 检查 map 中 是 否 包含 对 应 的 键 。 删 除 元 素 ， 代 码 为 : 


public boolean remove(Object o) { 
return m,remove(o)==PRESENT ， 
} 


就 是 调用 map 的 remove 方 法 ， 返 回 值 为 PRESENT 表 示 原 来 有 对 应 
的 键 且 删除 成 功 了 。 


TreeSet 的 实现 代码 都 比较 人 简单， 主要 就 是 调用 内 部 
NavigatableMap 的 方法 。 


10.5.3 小结 


本 市 介绍 了 TreeSet 的 用 法 和 实现 原理 ， 在 用 法 方面 ， 它 实现 了 Set 
接口 ， 但 有 序 ， 在 内 部 实现 上 ， 它 基于 TreeMap 实 现 ， 而 TreeMap 基 于 
大 致 平衡 的 排序 二 叉 树 : 红 黑 树 ， 这 决定 了 它 有 如 下 特点 。 

1) 没有 重复 元 素 。 


2) 添加 、 删 除 元 素 、 判 断 元 素 是 否 存在 ， 效 率 比 较 高 ， 为 O 
(og。 (N) ) ，N 为 元 素 个 数 。 


3) 有 序 ， 人 te 可 
以 方便 地 根据 顺序 进行 查找 和 操作 ， 如 第 一 个 、 最 后 一 个 、 某 一 取 值 
范围 、 某 一 值 的 邻近 元 素 等 。 


4) 为 了 有 序 ，TreeSet 要 求 元 素 实现 Comparable 接 口 或 通过 构造 方 
法 提供 一 个 Com-parator 对 象 。 


10.6” 襄 析 LinkedHashMap 


前 面 我 们 介绍 了 Map 接 口 的 两 个 实现 类 HashMap 和 TreeMap， 本 六 
介绍 另 一 个 实现 类 LinkedHashMap。 它 是 HashMap 的 子 类 ， 但 可 以 保持 
元 素 按 插入 或 访问 有 序 ， 这 与 TreeMap 按 键 排序 不 同 。 按 插入 有 序 容易 
理解 ， 按 访问 有 序 是 什么 意思 呢 ? 这 两 个 有 序 有 什么 用 呢 ? 内 部 是 怎 
么 实现 的 ? 本 市 就 来 探讨 这 些 问 题 ， 从 用 法 开始 。 


10.6.1 基本 用 法 


LinkedHashMap 是 HashMap 的 子 类 ， 但 内 部 还 有 一 个 双向 链表 维护 
键 值 对 的 顺序 ， 每 个 键 值 对 既 位 于 哈 硕 表 中 ， 也 位 于 这 个 双 辐 链表 
ee 一 种 是 插入 顺序 ; 另外 一 种 是 访问 
顶 这。 


插入 顺序 容易 理解 ， 先 添加 的 在 前 面 ， 后 添加 的 在 后 面 ， 修 改 操 
作 不 影响 顺序 。 访 问 顺序 是 什么 意思 呢 ? 所谓 访问 是 指 get/put 操 作 ， 对 
一 个 键 执行 get/put 操 作 后 ， 其 对 应 的 键 值 对 会 移 到 链表 末尾 ， 所 以 ， 最 
2 最 开始 的 最 和 久 没 被 访问 的 ， 这 种 顺序 就 是 访问 
由 厢 。 


LinkedHashMap 有 5 个 构造 方法 ， 其 中 4 个 都 是 按 插入 顺序 ， 只 有 一 
个 构造 方法 可 以 指定 按 访问 顺序 ， 如 下 所 示 : 


public LinkedHashMap(int initialCapacity, float loadFactor, 
boolean accessOrder) 


其 参数 accessOrder 束 是 用 来 指定 是 否 按 访问 顺序 ， 如 果 为 true， 
就 是 访问 顺序 。 


默认 情况 下 ，LinkedHashMap 是 按 搬入 有 序 的 ， 我 们 看 个 例子 : 


Map<String,Integer> seqMap = new LinkedHashMap<>( ) ; 
seqMap.put("c", 100); 
seqMap.put("d", 200); 
seqMap.put("a", 500); 


seqMap.put("d", 300); 
for(Entry<String,Integer> entry : seqMap.entrySet())t{ 
System.out.printlin(entry.getkey()+" "+entry.getValue()); 


刍 是 按照 "c"、"d"、"a" 的 顺序 插入 的 ， 修 改 "d" 的 值 不 会 修改 顺 
序 ， 所 以 输出 为 : 


c 100 
d 300 
a 500 


什么 时 候 希 望 保持 插入 顺序 呢 ? 


Map 经 常用 来 处 理 一 些 数据 ， 其 处 理 模式 是 : 接收 一 些 键 值 对 作为 
输入 ， 处 理 ， 然 后 输出 ， 输 出 时 希望 保持 原来 的 顺序 。 比 如 一 个 配置 
文件 ， 其 中 有 一 些 键 值 对 形式 的 配置 项 ， 但 其 中 有 一 些 键 是 重复 的 ， 
希望 保留 最 后 一 个 值 ， 但 还 是 按 原 来 的 键 顺 序 输出 ，LinkedHashMap 整 
是 一 个 合适 的 数据 结构 。 


再 如 ， 布 望 的 数据 模型 可 能 忠 古 一 个 Map， 但 布 望 休 持 添加 的 顺 
Se 
亨 保 存 。 


另外 一 种 常见 的 场景 是 : 希望 Map 能 够 按键 有 序 ， 但 在 添加 到 Map 
前 ， 键 已 经 通过 其 他 方式 排 好 序 了 ， 这 时 ， 就 没有 必要 使 用 TreeMap 
了 ， 毕 竟 TreeMap 的 开销 要 大 一 些 。 比 如 ， 在 从 数据 库 查 询 数据 放 到 内 
存 时 ， 可 以 使 用 SQL 的 order by 语句 让 数据 库 对 数据 排序 。 


我 们 来 看 按 访 问 有 序 的 例子 ， 代 码 如 下 : 


Map<String,Integer> accessMap = new LinkedHashMap<>(16, 0.75f, true); 

accessMap.put("c", 100); 

accessMap.put("d", 200); 

accessMap.put("a", 500); 

accessMap.get("c"); 

accessMap.put("d", 300); 

for(Entry<String, Integer> entry : acceSsSsMap .entrySet() ){ 
System.out.printin(entry.getkey()+" "+entry.getValue()); 

} 


每 次 访问 都 会 将 该 键 值 对 移 到 末尾 ， 所 以 输出 为: 


a 500 
c 100 
d 300 


什么 时 候 布 望 按 访问 有 序 呢 ? 一 种 典型 的 应 用 是 LRU 缓 存 ， 它 是 
什么 呢 ? 


绥 存 是 计算 机 技术 中 一 种 非 第 有 用 的 技术 ， 是 一 个 通用 的 提升 数 
据 访 问 性 能 的 思路 ， 一 般 用 来 保存 前 用 的 数据 ， 容 量 较 小 ， 但 访问 更 
快 。 缓 存 是 相对 主 存 而 言 的 ， 主 存 的 容量 更 大 ， 但 访问 更 慢 。 缓 存 的 
基本 假设 是 : 数据 会 被 多 次 访问 ， 一 般 访问 数据 时 都 完 从 缓存 中 找 ， 
缓存 中 没有 再 从 主 存 中 找 ， 找 到 后 再 放 入 缓存 ， 这 样 下 次 如 果 再 找 相 
同 数据 访问 束 快 了 。 


缓存 用 于 计算 机 技术 的 各 个 领域 ， 比 如 CPU 里 有 缓存 ， 有 一 级 组 
存 、 二 级 缓存 、 三 级 缓存 等 ， 一 级 缓存 非常 小 、 非 营 贯 、 也 非常 快 ， 
三 级 缓存 则 大 一 些 、 便 宜 一 些 、 也 慢 一 些 ，CPU 缓 存 是 相对 于 内 人 存 而 
言 的 ， 它 们 都 比 内 存 快 。 内 存 里 也 有 缓存 ， 内 存 的 缓存 一 般 是 相对 于 
人 硬盘 数据 而 言 鸭 。 硬 盘 也 可 能 是 缓存 ， 缓 存 网 络 上 其 他 机 天 的 数据 ， 
比如 浏览 器 访问 网 页 时 ， 会 把 一 些 网 页 缓存 到 本 地 硬盘。 


LinkedHashMap 可 以 用 于 缓存 ， 比 如 缓存 用 户 基本 信息 ， 键 是 用 户 
Id， 值 是 用 户 信息 ， 所 有 用 户 的 信息 可 能 保存 在 数据 库 中 ， 部 分 活跃 用 
户 的 信息 可 能 保存 在 缓存 中 。 


一 般 而 言 ， 缓 存 容 量 有 限 ， 不 能 无 限 存储 所 有 数据 ， 如 果 绥 存 满 
了 ， 当 需要 存储 新 数据 时 ， 就 需要 一 定 的 策略 将 一 些 老 的 数据 清理 出 
去 ， 这 个 策略 一 般 称 为 替换 算法 。LRU 是 一 种 流行 的 替换 算法 ， 它 的 
全 称 是 Least Recently Used， 即 最 近 最 少 使 用 。 它 的 思路 是 ， 最 近 刚 被 
使 用 的 很 快 再 次 被 用 的 可 能 性 最 高 ， 而 最 久 没 被 访问 的 很 快 再 次 被 用 
的 可 能 性 最 低 ， 所 以 被 优先 清理 。 

使 用 LinkedHashMap， 可 以 非常 容易 地 实现 LRU 绥 存 ， 默 认 情 况 


下 ，LinkedHashMap 没 有 对 容量 做 限制 ， 但 它 可 以 容易 地 做 到 ， 它 有 一 
个 protected 方 法 ， 如 下 所 示 : 


protected boolean removeEldestEntry(Map.Entry<K,V> eldest) { 
return false; 
} 


在 添加 元 系 到 LinkedHashMap 后 ，LinkedHashMap 会 调用 这 个 方 
法 ， 传 递 的 参数 是 最 久 没 被 访问 的 键 值 对 ， 如 果 这 个 方法 返回 true， 则 
这 个 最 入 的 键 值 对 丈 会 被 删除 。Linked-HashMap 的 实现 总 是 返回 
false， 所 有 容量 没有 限制 ， 但 子 类 可 以 重 写 该 方法 ， 在 满足 一 定 条 件 
的 情况 ， 返 回 true 。 


代码 清单 10-4 就 是 一 个 简单 的 LRU 缓 存 的 实现 ， 它 有 一 个 容量 限 
制 ， 这 个 限制 在 构造 方法 中 传递 。 


代码 清单 10-4 ”LRU 缓存 


public class LRUCache<Kk, V> extends LinkedHashMap<K, V> { 
private int maxEntries; 
public LRUCache(int maxEntries){ 
super(16, 0.75f, true); 
this.maxEntries = maxEntries,; 


Q@Override 
protected boolean removeEldestEntry(Entry<K, V> eldest) { 
return size() > maxEntries,; 


这 个 缓存 可 以 这 么 用 : 


LRUCache<String,Object> cache = new LRUCache<>(3); 
cache.put("a", "abstract"); 

cache.put("b", "basic"); 

cache.put("c", "call"); 

cache.get("a"); 

cache.put("d", "call"); 

System.out.printlin(cache),; 


限定 缓存 容量 为 3， 先后 添加 了 4 个 键 值 对 ， 最 入 没 被 访问 的 键 
征 "b"， 会 被 删除 ， 所 以 输出 为 : 


{c=call, a=abstract, d=call} 


10.6.2 ”实现 原理 


理解 了 LinkedHashMap 的 用 法 ， 下 面 我 们 来 看 其 实现 代码 (基于 
Java 7) 。 先 来 看 内 部 组 成 ， 再 看 一 些 主要 方法 的 实现 。 
LinkedHashMap 是 HashMap 的 子 类 ， 内 部 增加 了 如 下 实例 变量 


private transient Entry<K,V> header ; 
private final boolean accessOrder; 


accessOrder 表 示 是 按 访问 顺序 还 是 插入 顺序 。header 表 示 双 向 链表 
的 头 ， 它 的 类 型 Entry 是 一 个 内 部 类 ， 这 个 类 是 HashMap.Entry 的 子 类 ， 
增加 了 两 个 变量 before 和 after， 指 同 链 表 中 的 前 弛 和 后 继 ，Entry 的 完整 
定义 如 代码 清单 10-5 所 示 。 


代码 清单 10-5 ”LinkedHashMap 中 的 Entry 


private static class Entry<K,V> extends HashMap.Entry<K,V> { 
Entry<K,V> before, after,; 
Entry(int hash，K key, V value, HashMap.Entry<K,V> next) { 
super(hash, key, value, next); 


private void remove() { 
before.after = after,; 
after.before = before,; 


} 
private void addBefore(Entry<K,V> existingEntry) { 
after = existingEntry; 
before = existingEntry.before; 
before.after = this; 
after.before = this,; 


void recordAccess(HashMap<K,V> m) { 
LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m; 
if(Jlm.accessOrder) { 
lm.modCount++; 
remove(); 
addBefore(lm.header); 


} 


void recordRemoval(HashMap<K,V> m) { 
remove(); 


recordAccess 和 recordRemoval 是 HashMap.Entry 中 定义 的 方法 ， 在 
HashMap 中 ， 这 两 个 方法 的 实现 为 空 ， 它 们 就 是 被 设 计 用 来 袖子 类 重 


写 的 。 在 put 被 调用 且 键 存在 时 ，HashMap 会 调用 Entry 的 recordAccess 方 
法 ; 在 键 被 删除 时 ，HashMap 会 调用 Entry 的 recordRemoval 方 法 。 


LinkedHashMap.Entry 重 写 了 这 两 个 方法 。 在 recordAccess 方 法 中 ， 
如 有 果 是 按 访问 顺序 的 ， 则 将 该 节点 移 到 链表 的 末尾 ;在 recordRemoval 
方法 中 ， 将 该 入 点 从 链表 中 移 除 。 


了 解 了 内 部 组 成 ， 我 们 来 看 操作 方法 ， 先 看 构造 方法 。 
在 HashMap 的 构造 方法 中 ， 会 调用 init 方 法 ，init 方 法 在 HashMap 的 


实现 中 为 空 ， 也 是 被 设计 用 来 被 重 写 的 。LinkedHashMap 重 写 了 该 方 
法 ， 用 于 初始 化 链表 的 头 廊 点， 代码 如 下 : 


void init() { 
header = new Entry<>(-1, null, null, null); 
header .before = header.after = header; 


} 


header 被 初始 化 为 一 个 Entry 对 象 ， 前 驱 和 后 继 都 指向 自己 ， 如 图 
10-12 所 示 。 


header 


before| 一 | 
afer| 一 


图 10-12 ”LinkedHashMap 初 始 内 存 结构 


headerafter 指 回 第 一 个 丰 点 ，headerbefore 指 加 最 后 一 个 万 点 ， 指 
向 header 表 示 链 表 为 空 。 


在 LinkedHashMap 中 ， put 方 法 还 会 将 节点 加 入 到 链表 中 来 ， 如 条 
序 的， 还 会 调整 节点 到 末尾 ， 并 根据 情况 删除 最 久 没 被 访 
问 的 节点 。 


HashMap 的 put 实 现 中 ， 如 果 是 新 的 键 ， 会 调用 addEntry 方 法 添加 节 
点 ，LinkedHash-Map 重 写 了 该 方法 ， 代 码 为 : 


void addEntry(int hash，K key, V value, int bucketIndex) { 
super.addEntry(hash, key, value, bucketIndex); 
//Remove eldest entry if instructed 
Entry<K,V> eldest = header.after; 
if(removeEldestEntry(eldest)) { 
removeEntryForKey(eldest .key); 


它 先 调用 父 类 的 addEntry 方 法 ， 父 类 的 addEntry 会 调用 createEntry 
创建 节点 ，Linked-HashMap 重 写 了 createEntry， 代 码 为 : 


void createEntry(int hash，K key, V value, int bucketIndex) { 
HashMap.Entry<K,V> old = table[bucketIindex]; 
Entry<K,V> e = new Entry<>(hash, key, value, 01d); 
table[bucketIindex] = e; 
e,addBefore(header ) ; 
Sizet+; 


| 新 建 节 点 ， 加 入 哈 希 表 中 ， 同 时 加 入 链表 中 ， 加 到 链表 末尾 的 代 
码 是 ; 


e.addBefore(header) 


比如 ， 执 行 如 下 代码 : 


Map<String,Integer> countMap = new LinkedHashMap<>(); 
countMap.put("hello", 1); 


执行 后 ， 内 存 结构 如 图 10-13 所 示 。 


next | null 
befoe| 一 | 


after 


_hash |96207088 


| se | 
threshold 


图 10-13 ”LinkedHashMap 插 入 一 个 元 素 后 的 内 存 结构 


添加 完 后 ， 调 用 removeEldestEntry 检 查 是 否 应 该 删除 老 节 点 ， 如 果 
返回 值 为 tue， 则 调用 removeEntryForKey 进 行 删除 ，remove- 


EntryForKey 是 HashMap 中 定义 的 方法 ， 删 除 市 点 时 会 调用 
HashMap.Entry 的 record-Removal 方 法 ， 该 方法 被 LinkedHashMap.Entry 
重 写 了 了 ， 会 将 方 点 从 链表 中 删除 。 


在 HashMap 的 put 实 现 中 ， 如 有 果 键 已 经 存在 了 ， 则 会 调用 和 点 的 
recordAccess 方 法 。LinkedHashMap.Entry 重 写 了 该 方法 ， 如 果 是 按 访问 
有 序 ， 则 调整 该 节点 到 链表 末尾 。 


LinkedHashMap 重 写 了 get 方法， 代码 为 : 


public V get(Object key) { 
Entry<K,V> e = (Entry<K,V>)getEntry(key); 
if(e == null) 
return null; 
e.recordAccess(this); 
return e.value; 


} 


与 HashMap 有 的 get 方 法 的 区 别 ， 主 要 是 调用 了 节点 的 recordAccess 方 
法 ， 如 果 是 按 访问 有 序 ，recordAccess 调 整 该 节点 到 链表 末尾 。 


查看 HashMap 中 征 否 包含 茶 个 值 需要 进行 过 有 历 ， 由 于 
LinkedHashMap 维 护 了 单独 的 链表 ， 它 可 以 使 用 链表 进行 更 为 高 效 的 电 
历 ， 具 体 代 码 比较 商 单 ， 我 们 融 不 列举 了 。 


以 上 就 是 LinkedHashMap 的 基本 实现 原理 ， 它 是 HashMap 的 子 类 ， 
它 的 和 点 类 LinkedHashMap.Entry 是 HashMap.Entry 的 子 类 ， 
LinkedHashMap 内 部 维护 了 一 个 单独 的 双 同 链表 ， 每 个 市 点 即位 于 蛤 希 
表 中 ， 也 位 于 双 辣 链表 中 ， 在 链表 中 的 证 顺序 默认 是 插入 顺序 ， 也 可 以 
配置 为 访问 顺序 ，LinkedHashMap 及 其 节点 类 LinkedHashMap.Entry 重 
写 了 大 干 方法 以 维护 这 种 关系 。 


10.6.3 LinkedHashSet 


之 前 介绍 的 Map 接 口 的 实现 类 都 有 一 个 对 应 的 Set 接 口 的 实现 类 ， 
比如 HashMap 有 HashSet，TreeMap 有 TreeSet，LinkedHashMap 也 不 例 
外 ， 它 也 有 一 个 对 应 的 Set 接 口 的 实现 类 LinkedHashSet。LinkedHashSet 
是 HashSet 的 子 类 ， 它 内 部 的 Map 的 实现 类 是 LinkedHashMap， 所 以 它 
也 可 以 保持 插入 顺序 ， 比 如 : 


Set<String> set = new LinkedHashset<>(); 
set.add("b"); 

set.add("c"); 

set.add("a"); 

set.add("c"); 

System.out.printin(set); 


输出 为 : 
[b, c, al 
LinkedHashSet 的 实现 比较 人 简单， 我 们 就 不 再 介绍 了 。 
10.6.4 ”小结 


本 和 主要 介绍 了 LinkedHashMap 的 用 法 和 实现 原理 ， 用 法 上 ， 它 可 
以 保持 插入 顺序 或 访问 顺序 。 插 入 顺序 经 常用 于 处 理 键 值 对 的 数据 ， 
并 保持 其 输入 顺序 ， 也 经 常用 于 键 已 经 排 好 序 的 场景 ， 相 比 TreeMap 效 
率 更 高 ;访问 顺序 经 常用 于 实现 LRU 缓 不。 实现 原理 上 ， 它 是 
HashMap 的 子 类 ， 但 内 部 有 一 个 双 辣 链表 以 维护 节点 的 顺序 。 最 后 ， 
我 们 简单 介绍 了 LinkedHashSet， 它 是 HashSet 的 子 类 ， 但 内 部 使 用 
LinkedHashMap。 


10.7 “剖析 EnumMap 


如 果 需 要 一 个 Map 的 实现 类 ， 并 且 键 的 类 型 为 枚 举 类 型 ， 可 以 使 
用 HashMap， 但 应 该 使 用 一 个 专门 的 实现 类 EnumMap。 为 什么 要 有 一 
个 专门 的 类 呢 ? 我 们 之 前 介绍 过 枚 举 的 本 质 ， 主 要 是 因为 枚 举 类 型 有 
两 个 特征 : 一 是 它 可 能 的 值 是 有 限 的 且 预 移 定 义 的 ;二 是 枚 举 值 都 有 
一 个 顺序 ， 这 两 个 特征 使 得 可 以 更 为 高 效 地 实现 Map 接 口 。 我 们 先 来 
看 EnumMap 的 用 法 ， 然 后 看 它 到 底 是 怎么 实现 的 。 


10.7.1 基本 用 法 


举 个 位 单 的 例子 。 比 如 ， 有 一 批 关 于 衣服 的 记录 ， 我 们 布 望 按 尺 
寸 统 计 衣服 的 数量 。 定 义 一 个 简单 的 枚 举 类 Size， 表 示 衣 服 的 尺寸 : 


public enum Size { 
SMALL, MEDIUM, LARGE 
} 


定义 一 个 简单 类 Clothes， 表 示 衣 服 : 


class Clothes { 

String id; 

Size size; 

// 省 略 getter/setter 和 构造 方法 
} 


有 一 个 表示 衣服 记录 的 列表 List<Clothes>， 我 们 希望 按 尺 寸 统 计 
数量 ， 统 计 方 法 可 以 为 : 


public static Map<Size, Integer> countBySize(List<Clothes> clothes){ 
Map<Size, Integer> map = new EnumMap<>(Size.class); 
for(Clothes c : clothes)t{ 
Size size = c.getSizel(); 
Integer count = map.get(size); 
if(count!=null){ 
map.put(size, count+1); 
}elsef{ 
map.put(size, 1); 


return map 


} 


人 需要 注意 的 是 EnumMap 的 构造 方法 ， 如 下 
和 个: 


Map<Size, Integer> map = new EnumMap<>(Size.class); 


与 HashMap 不 同 ， 它 需要 传递 一 个 类 型 信息 ，Size.class 表 示 枚 举 
类 Size 的 运行 时 类 型 信息 ，Size.class 也 是 一 个 对 象 ， 它 的 类 型 是 
Class。 为 什么 需要 这 个 参数 呢 ? 没有 这 个 ，EnumMap 就 不 知道 具体 的 
枚 举 类 是 什么 ， 也 无 法 初始 化 内 部 的 数据 结构 。 


使 用 以 上 的 统计 方法 也 是 很 简单 的 ， 比 如 : 


List<Clothes> clothes = Arrays.asList(new Clothes[]{ 
new Clothes("C001",Size.SMALL), new Clothes("C002", Size.LARGE), 
new Clothes("C003", Size.LARGE), new Clothes("c004", Size.MEDIUM), 
new Clothes("C005", Size.SMALL), new Clothes("c006", Size.SMALL), 


}); 
System.out.println(countBySize(clothes)); 


AN 等 
输出 为 : 
{SMALL=3, MEDIUM=1, LARGE=2} 


需要 说 明 的 是 ， 与 HashMap 不 同 ，EnumMap 是 保证 顺序 的 ， 输 出 
是 按照 键 在 枚 举 中 的 顺序 的 。 


你 可 能 认为 ， 对 于 枚 举 ， 使 用 Map 是 没有 必要 的 ， 比 如 对 于 上 面 
的 统计 例子 ， 可 以 使 用 一 个 简单 的 数组 : 


public static int[] countBySize(List<Clothes> clothes)t{ 
int[] stat = new int[Size.values().length]; 
for(Clothes c : clothes){ 
Size size = c.getSize(); 
stat[size.ordinal()]++; 


} 


return stat; 


} 
这 个 方法 可 以 这 么 使 用 : 


List<Clothes> clothes = Arrays.asList(new Clothes[]{ 
new Clothes("C001",Size.SMALL), new Clothes("C002", Size.LARGE), 
new Clothes("C003", Size.LARGE), new Clothes("c004", Size.MEDIUM), 
new Clothes("C005", Size.SMALL), new Clothes("c006", Size.SMALL), 

}); 

int[] stat = countBySize(clothes); 

for(int i=0; i<stat.length; i++){ 

System,.out.println(Size.values()[i]+": "+ stat[i]); 


输出 为 : 


SMALL 3 
MEDIUM 1 
LARGE 2 


可 以 达到 同样 的 目的 。 但 ， 直 接 使 用 数组 需要 目 己 维护 数组 索引 
和 枚 举 值 之 间 的 关系 ， 正 如 枚 举 的 优点 十 简 洁 、 安 全 、 方 便 一 样 ， 
EnumMap 同 样 是 更 为 简 消 、 安 人 全、 方便 ， 它 内 部 也 是 基于 数组 实现 
的 ,但 隐藏 了 细节 ， 提 供 了 更 为 方便 安全 的 接口 。 


10.7.2 ”实现 原理 


下 面 我 们 来 看 下 具体 的 代码 (基于 Java 7) 。 从 内 部 组 成 开始 。 
EnumMap 有 如 下 实例 变量 : 


private final Class<K> keyType; 
private transient K[] keyUniverse; 
private transient Object[] vals; 
private transient int size = 0; 


keyType 表 示 类 型 信息 ，keyUniverse 表 示 键 ， 是 所 有 可 能 的 枚 举 
nn size 表 示 键 值 对 个 数 。EnumMap 的 基本 构造 
法 代码 为 : 


public EnumMap(Class<K> keyType) { 
this.keyType = keyType; 
keyUniverse = getkeyUniverse(keyType); 
vals = new Object[keyUniverse.1length]; 


} 


调用 了 getKeyUniverse 以 初始 化 键 数组 ， 这 上段 代码 又 调用 了 其 他 一 
些 比 较 底 层 的 代码 ， 就 不 列举 了 了 人， 原理 是 最 终 调用 了 枚 举 类 型 的 
values 方 法 ，values 方 法 返回 所 有 可 能 的 枚 举 值 。 关 于 values 方 法 ， 我 
们 在 枚 举 一 节 介绍 过 其 用 法 和 实现 原理 ， 这 里 就 不 蕉 述 了 。 


保存 键 值 对 的 方法 是 put， 代 码 力 : 


public V put(K key, V value) { 
typeCheck(key); 
int index = key.ordinal(); 
Object oldValue = vals[index]; 
vals[index] = maskNull(value); 
if(oldValue == null) 

SIZe++， 

return unmaskNull(oldValue); 


首先 调用 typeCheck 检 查 键 的 类 型 ， 其 代码 为 : 


private void typeCheck(K key) { 
Class keyClass = key.getclass(); 
if(keyClass != keyType && keyClass.getSuperclass() != keyType) 
throw new ClassCastException(keyClass + " != " + keyType); 


如 果 类 型 不 对 ， 会 抛 出 异常 。 如 果 类 型 正确 ， 调 用 ordinal 获 取 索 
引 index， 并 将 值 value 放 入 值 数组 vals[index] 中 。EnumMap 人 允许 值 为 
nul， 为 了 区 别 null 值 与 没有 值 ，EnumMap 将 null 值 包装 成 了 一 个 特殊 
的 对 象 ， 有 两 个 辅助 方法 用 于 null 的 打包 和 解 包 ， 打 包 方 法 为 
ou ， 解 包 方 法 为 unmaskNull。 这 个 特殊 对 象 及 两 个 方法 的 代码 


private static final Object NULL = new Object() { 
public int hashCode() { 
return ©; 


} 
public String toString() { 


return "java.util.EnumMap.NULL"; 


} 

}; 

private Object maskNull(Object value) { 
return (value == null ? NULL : value); 


private V unmaskNull(Object value) { 
return(V) (value == NULL ? null : Value)， 


根据 键 获取 值 的 方法 是 get， 代 码 为 : 


public V get(Object key) { 
return (isvalidkey(key) 
unmaskNull(vals[((Enum)key).ordinal()]) : nul1)， 


如 果 键 有 效 ， 通 过 ordinal 方 法 取 索 引 ， 然 后 直接 在 值 数组 vals 里 
找 。isValidKey 的 代码 与 typeCheck 类 似 ， 但 是 返回 boolean 值 而 不 是 抛 
出 异常 ， 代 码 为 : 


private boolean isValidKey(Object key) { 
if(key == null) 
return false,; 
//Cheaper than instanceof Enum followed by getDeclaringClass 
Class keyClass = key.getclass(); 
return keyClass == keyType || keyClass.getSuperclass() == keyType; 


查看 是 否 包 含 某 个 值 的 方法 是 containsValue， 代 码 为 : 


public boolean containsValue(Object value) { 
value = maskNull(value); 
for(Object val : vals) 
if(value.equals(val)) 
return true; 
return false,; 


就 是 带 历 值 数组 进行 比较 。 
根据 键 删除 的 方法 是 remove， 其 代码 为 : 


public V remove(Object key) { 

if(!isValidkKey(key)) 

return null; 
int index = ((Enum)key).ordinal(); 
Object oldvalue = vals[index]; 
vals[index] = null; 
if(oldValue != null) 

Size--,; 
return unmaskNull(oldValue); 


代码 也 很 简单 ， 就 不 解释 了 。 
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本 节 介 绍 了 EnumMap 的 用 法 和 实现 原理 ， 用 法 上 ， 如 果 需 要 一 个 
Map 且 键 是 枚 举 类 型 ， 则 应 该 用 它 ， 简 尘 、 方 便 、 安 全 ; 实现 原理 
上 ， 内 部 有 两 个 数组 ， 长 度 相 同 ， 一 个 表示 所 有 可 能 的 键 ， 一 个 表示 
对 应 的 值 ， 值 为 null 表 示 没 有 该 键 值 对 ， 键 都 有 一 个 对 应 的 索引 ， 根 
据 索 引 可 直接 访问 和 操作 其 键 和 值 ， 效 率 很 高 。 


下 一 节 ， 我 们 来 看 枚 举 类 型 的 Set 接 口 的 实现 类 EnumSet， 与 之 前 
介绍 的 Set 的 实现 类 不 同 ， 它 内 部 没有 用 对 应 的 Map 类 EnumMap ， 而 是 
使 用 了 一 种 极为 高 效 的 方式 ， 什 么 方式 呢 ? 


10.8 谢 析 EnumSet 


本 广 介 绍 同样 针对 枚 举 类 型 的 Set 接 口 的 实现 类 EnumSet 。 与 
EnumMap 类 似 ， 之 所 以 会 有 一 个 专门 的 针对 枚 举 类 型 的 实现 类 ， 主 要 
是 因为 它 可 以 非常 高 效 地 实现 Set 接 口 。 


之 前 介绍 的 Set 接 口 的 实现 类 HashSetTreeSet， 它 们 内 部 都 是 用 对 
应 的 HashMap/TreeMap 实 现 的 ， 但 EnumSet 不 是 ， 它 的 实现 与 
EnumMap 没 有 任何 关系 ， 而 是 用 极为 精简 和 高 效 的 位 同 量 实现 的 。 位 
Cn 我 们 有 必要 理解 和 掌 
全 O 〇 


除了 实现 机 制 ，EnumSet 的 用 法 也 有 一 些 不 同 。EnumSet 可 以 说 是 
ee 在 一 些 应 用 领域 ， 它 非常 方便 和 高 
效 。 


下 面 ， 我 们 先 来 看 EnumSet 的 基本 用 法 ， 然 后 通过 一 个 场景 来 看 
EnumSet 的 应 用 ， 最 后 分 析 EnumSet 的 实现 机 和 市。 


10.8.1 基本 用 法 


与 TreeSet/HashSet 不 同 ，EnumSet 是 一 个 抽象 类 ， 不 能 直接 通过 
new 新 建 ， 也 就 是 说 ， 类 似 下 面 代 码 是 错误 的 : 


EnumSet<Size> Set = new EnumSet<Size>(); 


不 过 ，EnumSet 提 供 了 奎 干 静态 工厂 方法 ， 可 以 创建 EnumSet 类 型 
的 对 象 ， 比 如 : 


public static <E extends Enum<E>> EnumSet<E> noneOf(Class<E> elementType) 


noneOf 方 法 会 创建 一 个 指定 枚 举 类 型 的 EnumSet， 不 含 任何 元 
素 。 创 建 的 EnumSet 对 象 的 实际 类 型 是 EnumSet 的 子 类 ， 答 会 我 们 再 分 


析 其 具体 实现 。 


为 方便 举例 ， 我 们 定义 一 个 表示 星期 几 的 枚 举 类 Day,， 


到 周 日 ， 如 下 所 示 : 


enum Day { 


} 


MONDAY, TUESDAY, WEDNESDAY, THURSDAY, FRIDAY, SATURDAY, SUNDAY 


可 以 这 么 用 noneOf 方 法 : 


Set<Day> weekend = EnumSet.noneof (Day.class); 


weekend.add(Day .SATURDAY ) ， 
weekend.add(Day .SUNDAY ); 
System.out.println(weekend); 


值 从 周一 


weekend 表 示 休 息 日 ，noneOf 返 回 的 Set 为 宝 ， 添 加 了 周 六 和 周 


日 ， 所 以 输出 为 : 


[SATURDAY, SUNDAY] 


EnumSet 还 有 很 多 其 他 静态 工厂 方法 ， 如 下 所 示 (省 略 了 修饰 


public static) 


// 初 始 集合 包括 指定 枚 举 类 型 的 所 有 枚 举 值 
allof(Class<E> elementType) 


<E extends Enum<E>> EnumSet<E> 
// 初 始 集合 包括 枚 举 值 中 指定 范围 的 元 素 
<E _ extends Enum<E>> EnumSet<E> 
// 初 始 集合 包括 指定 集合 的 补 集 
<E extends Enum<E>> EnumSet<E> 
// 初 始 集合 包括 参数 中 的 所 有 元 素 

<E extends Enum<E>> EnumSet<E> 
<E extends Enum<E>> EnumSet<E> 
<E extends Enum<E>> EnumSet<E> 
<E extends Enum<E>> EnumSet<E> 
<E extends Enum<E>> EnumSet<E> 
<E _ extends Enum<E>> EnumSet<E> 
// 初 始 集合 包括 参数 容器 中 的 所 有 元 素 
<E _ extends Enum<E>> EnumSet<E> 
<E _ extends Enum<E>> EnumSet<E> 


range(E from，E to) 


complementOof (EnumSet<E> s) 


of (E 
of (E 
of (E 
of (E 
of (E 
of (E 


e) 

el1l, E e2) 

el1l, E e2, E e3) 

el1l, E e2, E e3, E e4) 

el, E e2, E e3, E e4, E e5) 
first, E... rest) 


copyof (EnumSet<E> s) 
copyof(Collection<E> c) 


可 以 看 到 ，EnumSet 有 很 多 重 载 形式 的 of 方法 ， 最 后 一 个 接受 的 是 
可 变 参数 ， 其 他 重 裁 方 法 看 上 去 是 多 余 的 ， 之 所 以 有 其 他 重 载 方法 是 
因为 可 变 参数 的 运行 效率 低 一 些 。 


10.8.2 ”应 用 场景 


下 面 ， 我 们 通过 一 个 场景 来 看 EnumSet 的 应 用 。 想 象 一 个 场景 ， 
在 一 些 工 作 中 (如 医生 、 客 服 ) ， 不 是 每 个 工作 人 员 每 天 都 在 的 ， 每 
个 人 可 工作 的 时 间 是 不 一 样 的 ， 比 如 张 三 可 能 是 周一 和 周三 ， 李 四 可 
能 是 周 四 和 周 六 ， 给 定 每 个 人 可 工作 的 时 间 ， 我 们 可 能 有 一 些 问 题 需 
要 回答 。 比 如 : 

.有 没有 哪 天 一 个 人 都 不 会 来 ? 

.有 哪些 天 至 少 会 有 一 个 人 来 ? 

.有 哪些 天 至 少 会 有 两 个 人 来 ? 

-有 哪些 天 所 有 人 都 会 来 ， 以 便 开会 ? 

-哪些 人 周一 和 周二 都 会 来 ? 


使 用 EnumSet， 可 以 方便 高 效 地 回答 这 些 问题 ， 怎 么 做 呢 ? 我 们 
先 来 定义 一 个 表示 工作 人 员 的 类 Worker， 如 下 所 示 : 


class Worker { 

String name; 

Set<Day> availableDays; 

public Worker(String name, Set<Day> availableDays) { 
this.name = name; 
this.availableDays = availableDays,; 

} 

// 省 略 getter 方 法 


人 
驹 S: 


Worker[] workers = new Worker[]{ 
new Worker(" 张 三 "，EnumSet ,of( 


Day .MONDAY, Day.TUESDAY, Day .WEDNESDAY，Day .FRIDAY) )， 
new Worker(" 李 四 "，EnumSet .of( 

Day.TUESDAY，Day ,THURSDAY，Day ,SATURDAY) ) ， 
new Worker(" 王 五 "，EnumSet ,of(Day.TUESDAY，Day .THURSDAY ) )， 


}; 


每 个 工作 人 员 的 可 工作 时 间 用 一 个 EnumSet 表 示 。 有 了 这 个 信 
Ee ° 哪些 天 一 个 人 都 不 会 来 ? 代码 可 
以 为 : 


Set<Day> days = EnumSet .allof(Day.Cclass ) ， 
for(worker w : workers)t{ 
days.removeAll(w.getAvailableDays()); 


System.out.println(days); 


days 初 始 化 为 所 有 值 ， 然 后 明 历 workers， 从 days 中 删除 可 工作 的 
所 有 时 间 ， 最 终 璋 下 的 就 是 一 个 人 都 不 会 来 的 时 间 ， 这 实际 是 在 求 
worker 时 间 并 集 的 补 集 ， 输 出 为 : 


[SUNDAY] 


有 了 哪些 天 至 少 会 有 一 个 人 来 ? 就 是 求 worker 时 间 的 并 集 ， 代 码 可 
以 为 : 
Set<Day> days = EnumSet.noneof(Day.class); 
for(worker w : workers)t{ 
days.addAll(w.getAvailableDays( )); 


} 
System.out.println(days); 
< 人 AS » 
输出 为 : 
[MONDAY, TUESDAY, WEDNESDAY, THURSDAY, FRIDAY, SATURDAY] 


有 哪些 天 所 有 人 都 会 来 ? 束 是 求 worker 时 间 的 交集 ， 代 码 可 以 


站 
y 


Set<Day> days = EnumSet .allof(Day.Cclass ) ， 
for(worker w : workers){ 

days.retainAll(w.getAvailableDays()); 
} 


System.out.println(days); 
“AN y 
输出 为 : 

[TUESDAY] 


哪些 人 周一 和 周二 都 会 来 ? 使 用 containsAl 方 法 ， 代 码 可 以 为 : 


Set<worker> availableworkers = new HashSet<Worker>(); 
for(worker w : workers)t{ 
if(w.getAvailableDays().containsAll( 
EnumSet .of (Day .MONDAY, Day .TUESDAY) ) ){ 
availableworkers.add(w); 


} 


for(Worker w : availableworkers){ 
System.out.printljn(w.getName()); 
} 


输出 为 : 
张 三 


哪些 天 至 少 会 有 两 个 人 来 ? 我 们 先 使 用 EnumMap 统 计 每 天 的 人 
数 ， 然 后 找 出 至 少 有 两 个 人 的 天 ， 代 码 可 以 为 : 


Map<Day, Integer> countMap = new EnumMap<>(Day.class); 
for(Worker w : workers)t{ 
for(Day d : w.getAvailableDays())t{ 
Integer count = countMap.get(d); 
countMap.put(d, count==nyull1?1:count+1),; 


} 


} 
Set<Day> days = EnumSet.noneof(Day.class); 
for(Map.Entry<Day, Integer> entry : CountMap ,entrySet() ){ 
if(entry.getValue( )>=2){ 
days.add(entry.getkey()); 
} 
} 


System.out.println(days); 


输出 为 : 


[TUESDAY, THURSDAY] 


) 理解 了 EnumSet 的 使 用 ， 下 面 我 们 来 看 它 是 怎么 实现 的 (基于 Java 
7 oO 


10.8.3 ”实现 原理 


”EnumSet 是 使 用 位 向 量 实现 的 ， 什 么 是 位 向 量 昵 ? 就 是 用 一 个 位 
表示 一 个 元 素 的 状态 ， 用 一 组 位 表示 一 个 集合 的 状态 ， 每 个 位 对 应 一 
个 元 素 ， 而 状态 只 可 能 有 两 种 。 


对 于 之 前 的 枚 举 类 Day， 它 有 7 个 枚 举 值 ， 一 个 Day 的 集合 束 可 以 
用 一 个 字 广 byte 表 示 ， 最 高 位 不 用 ， 设 为 0， 最 右边 的 位 对 应 顺序 最 小 
的 枚 举 值 ， 从 右 到 左 ， 每 位 对 应 一 个 枚 举 值 ，1 表 示 包 含 该 元 素 ，0 表 
示 不 含 该 元 素 。 


比如 ， 表 示 包 含 Day.MONDAY 、Day.TUESDAY 、 
Day.WEDNESDAY、Day.FRIDAY 的 集合 ， 位 向 量 结构 如 图 10-14 所 
A]S O 


周 日 周 六 周 五 周 四 周三 周二 周一 
图 10-14 位 回 量 示例 


对 应 的 整数 是 23。 


“位 向 量 能 表示 的 元 素 个 数 与 向 量 长 度 有 关 ， 一 个 byte 类 型 能 表示 8 
个 元 素 ， 一 个 long 类 型 能 表示 64 个 元 素 ， 那 EnumSet 用 的 长 度 是 多 少 
呢 ? 


EnumsSet 是 一 个 抽象 类 ， 它 没有 定义 使 用 的 风量 长 度 ， 它 有 两 个 
子 类 : RegularEnumSet 和 JumboEnumSet。RegularEnumSet 使 用 一 个 
long 类 型 的 变量 作为 位 回 量 ，long 类 型 的 位 长 度 是 64， 而 
JumboEnumSet 使 用 一 个 long 类 型 的 数组 。 如 果 枚 举 值 个 数 小 于 等 于 
64， 则 静态 工厂 方法 中 创建 的 就 是 RegularEnumSet， 如 果 大 于 64 就 十 


JumboEnumSet ° 


理解 了 位 癌 量 的 基本 概念 ， 下 面 我 们 来 看 EnumSet 的 实现 ， 包 括 
其 内 部 组 成 和 一 尝 主 要 方法 有 实现 。 EnumSet 也 有 
表示 类 型 信息 和 所 有 枚 举 值 的 实例 变量 ， 如 下 所 示 : 


final Class<E> elementType; 
final Enum[] universe; 


elementType 表 示 类 型 信息 ，universe 表 示 枚 举 类 的 所 有 枚 举 值 。 


EnumSet 目 身 没有 记录 元 素 个 数 的 变量 ， 也 没有 位 向 量 ， 它 们 是 
子 类 维护 的 。 对 于 RegularEnumSet， 它 用 ee 位 向 量 ， 
代码 为 : 


private long elements = OL,; 


ee 它 没有 定义 表示 元 素 个 数 的 变量 ， 有 是 实时 计算 出 来 的 ， 计 算 的 代 
刁 征 : 


public int size() { 
return Long.bitCount(elements); 


} 


对 于 JumboEnumSet， 它 用 一 个 long 数 组 表示 ， 有 单独 的 size 变 
量 ， 代 码 为 : 


private long elements[]; 
private int size = 0,; 


我 们 来 看 EnumSet 的 静态 工厂 方法 noneOf， 代 码 为 : 


public static <E extends Enum<E>> EnumSet<E> noneof(CJlass<E> elementType) { 
Enum[] universe = getUniverse(elementType); 
if(universe == null) 
throw new ClassCastException(elementType + " not an enum"); 
if(universe.length <= 64) 
return new RegularEnumSet<>(elementType, universe),; 
else 
return new JumboEnumSet<>(elementType, universe); 


getUniverse 的 代码 与 EnumMap 是 一 样 的 ， 怠 不 性 述 了 。 如 果 元 系 
个 数 不 超 过 64， 就 创建 RegularEnumSet， 否 则 创建 JumboEnumSet 。 


RegularEnumSet 和 JumboEnumSet 的 构造 方法 为 : 


RegularEnumSet (Class<E>elementType, Enum[] universe) { 
super (elementType, universe); 


JumboEnumSet (Class<E>elementType, Enum[] universe) { 
super (elementType, universe); 
elements = new long[ (universe.length + 63) >>> 6]; 


} 
它们 都 调用 了 父 类 EnumSet 的 构造 方法 ， 其 代码 为 : 


EnumSet(Class<E>elementType, Enum[] universe) { 
this.elementType = elementType; 
this.universe = Universe 


就 是 给 实例 变量 赋值 ，JumboEnumSet 根 据 元 素 个 数 分 配 足 够 长 度 
的 long 数 组 。 


其 他 工厂 方法 基本 都 是 先 调用 noneOf 方 法 构造 一 个 空 的 集合 ， 然 
人 。 我们 来 看 添加 方法 ，RegularEnumSet 的 add 方 法 的 
人 码 为 : 


public boolean add(E e) { 


typeCheck(e); 

long oldElements = elements,; 

elements |= (1L << ((Enum)e).ordinal()); 
return elements != oldElements,; 


主要 代码 是 按 位 或 操作 : 


elements |= (1L << ((Enum)e).ordinal()); 


(1L<< ( (Enum) e) .ordinal () ) 将 元 素 e 对 应 的 位 设 为 1， 与 
现 有 的 位 疝 量 elements 相 或 ， 就 表示 添加 e 了“。JumboEnumSet 的 add 方 
法 的 代码 为 : 


public boolean add(E e) { 
typeCheck(e); 
int eordinal = e.ordinal(); 
int eWordNum = eOrdinal >>> 6; 
long oldElements = elements[ewWordNum]; 


elements[ewordNum] |= (1L << eOrdinal); 
boolean result = (elements[ewordNum] != oldElements); 
if(result) 

SIZe++， 


return result 


与 RegularEnumSet 的 add 方 法 的 区 别 是 ， 它 移 找 对 应 的 数组 位 置 ， 
eOrdinal>>>6 束 是 eOrdinal 除 以 64， eWordNum 束 表示 数组 索 引 ， 有 了 
索引 之 后 ， 其 他 操作 与 Regular-EnumSet 束 类 似 了 。 


对 于 其 他 操作 ，JumboEnumSet 的 思路 是 类 似 的 ， 主 要 算法 与 
RegularEnumSet 一 样 ， 主 要 是 增加 了 寻找 对 应 long 位 向 量 的 操作 ， 或 
者 有 一 些 循 环 处理 ， 逻 辑 也 都 比较 简单 ， 后 文 束 只 介绍 
RegularEnumSet 的 实现 了 。 


RegularEnumSet 的 remove 方 法 的 代码 为 : 


public boolean remove(Object e) { 

if(e == null 
return false,; 

Class eClass = e.getClass(); 

if(eClass != elementType && eClass.getSuperclass() != elementType) 
return false,; 

long oldElements = elements,; 

elements &= ~(1L << ((Enum)e).ordinal()); 

return elements != oldElements,; 


主要 代码 是 : 


elements &= ~(1L << ((Enum)e).ordinal()); 


~ 是 取 反 ， 该 代码 将 元 素 e 对 应 的 位 设 为 了 0， 这 样 就 完成 了 删除 。 
查看 是 否 包 含 某 元 素 的 方法 是 contains， 其 代码 为 : 


public boolean contains(Object e) { 
if(e == null) 
return false,; 
Class eClass = e.getClass(); 
if(eClass != elementType && eClass.getSuperclass() != elementType) 
return false,; 
return (elements & (1L << ((Enum)e).ordinal())) != 0; 


代码 也 很 简单 ， 按 位 与 操作 ， 不 为 0， 则 表示 包含 。 
EnumSet 的 静态 工厂 方法 complementOf 是 求 补 集 ， 它 调用 的 代码 


f 氏 


void complement() { 
if(universe.length != 0) { 
elements = ~elements,; 
elements &= -1L >>> -universe.length; // Mask unused bits 


} 
} 


这 段 代 码 有 点 上 蜀 汪 ，elements=~elements 比 较 容 易 理解 ， 束 是 按 位 
取 反 ， 相 当 于 就 是 取 补 集 ， 但 我 们 知道 elements 是 64 位 的 ， 当 前 枚 举 
类 可 能 没有 用 那么 多 位 ， 取 反 后 高 位 部 分 都 变 为 了 1， 需 要 将 超出 
universe.length 的 部 分 设 为 0°。 下 面 的 代码 就 是 在 做 这 件 事 : 


elements &= -1L >>> -universe.length; 


-] 志 征 64 位 全 1 的 二 进 制 ， 我 们 在 剖析 Integer 一 节 介 绍 过 移动 位 数 
征 负 数 的 情况 ， 上 面 代 码 相当 于 : 


elements &= -1L >>> (64-universe,. length ) ， 


如 果 universe.length 为 7， 则 -1L>>> (64-7) 就 是 二 进 制 的 
1111111， 与 elements 相 与 ， 就 会 将 超出 universe.length 部 分 的 右边 的 57 
位 都 变 为 0。 


以 上 就 是 Enumset 的 基本 实现 原理 ， 内 部 使 用 位 向 量 ， 表 示 很 简 
洁 ， 节 省 空间 ， 大 部 分 操作 都 是 按 位 运算 ， 效 率 极 高 。 


10.84 水 结 


本 节 介 绍 了 EnumSet 的 用 法 和 实现 原理 ， 用 法 上 ， 它 是 处 理 枚 举 
类 型 数据 的 一 把 利 眉 ， 简 涪 方 便 ， 实 现 原理 上 ， 它 使 用 位 同 量 ， 精 简 


高 效 。 


对 于 只 有 两 种 状态 ， 且 需要 进行 集合 运算 的 数据 ， 使 用 位 辐 量 进 
行 表示 、 位 运算 进行 处 理 ， 是 计算 机 程序 中 一 种 常用 的 思维 方式 。 


Java 中 有 一 个 更 为 通用 的 可 动态 扩展 长 度 的 位 癌 量 容 右 类 BitSet， 
可 以 方便 地 对 指定 位 置 的 位 进行 操作 ， 与 其 他 位 癌 量 进行 位 运算 ， 具 
体 可 参看 API 文 档 ， 我 们 就 不 介绍 了 。 

至 此 ， 关 于 Map 和 Set 的 实现 类 束 介 绍 完了 ， 关 于 它们 的 系统 总 
人 一 草 ， 我 们 来 看 另 一 种 数 


第 11 草 ” 堆 与 优先 级 队列 


前 面 两 章 介绍 了 Java 中 的 基本 容 圳 类 ， 每 个 容 需 类 背后 都 有 一 种 
数据 结构 ，ArrayList 是 动态 数组 ，LinkedList 是 链表 ， 
HashMap/HashSet 是 哈 希 表 ，TreeMap/TreeSet 是 红 黑 树 ， 本 章 介 绍 男 一 
种 数据 结构 : 堆 。 之 前 我 们 提 到 过 堆 ， 那 里 ， 堆 指 的 是 内 存 中 的 区 
域 ,保存 动态 分 配 的 对 象 ， 与 栈 相对 应 。 这 里 的 堆 是 一 种 数据 结构 ， 
与 内 存 区 域 和 分 配 无 关 。 


扒 到 抵 是 什么 结构 呢 ? 这 个 待 会 再 细 看 。 我 们 移 来 说 明 ， 堆 有 什 
0 
站: 


1) 优先 级 队列 ， 我 们 之 前 介绍 的 队列 实现 类 LinkedList 是 按 添加 
顺序 排列 的 ， 但 现实 中 ， 经 党 需 要 按 优 移 级 来 ， 每 次 都 应 该 处 理 当前 
队列 中 优先 级 最 高 的 ， 高 优先 级 的 即使 来 得 晚 ， 也 应 该 被 优 先 处 理 。 


2) 求 前 K 个 最 大 的 元 素 ， 元 素 个 数 不 确 定 ， 数 据 量 可 能 很 大 ， 其 
至 源源 不 断 到 来 ， 但 需要 知道 到 目前 为 止 的 最 大 的 前 K 个 元 素 。 这 个 
和 最 小 的 元 隶 。 


3) 求 中 值 元 素 ， 中 值 不 是 平均 值 ， 而 是 排序 后 中 间 那 个 元 素 的 
值 ， 同样， 数据 量 可 能 很 大 ， 甚 至 源源 不 断 到 来 。 


堆 还 可 以 实现 排序 ， 称 之 为 堆 排 序 ， 不 过 有 比 它 更 好 的 排序 算 
法 ， 所 以 ， 我 们 融 不 介绍 其 在 排序 中 的 应 用 了 。 

Java 容 絮 中 有 一 个 类 PriorityQueue， 表 示 优 先 级 队列 ， 它 实现 了 
堆 ， 本 章 我 们 会 详细 介绍 。 关 于 如 何 使 用 堆 高 效 解 决 求 前 K 个 最 大 的 
元 素 和 求 中 值 元 素 ， 我 们 也 会 在 本 章 中 用 代码 实现 并 详细 解释 。 


说 了 这 么 多 好 处 ， 堆 到 底 是 什么 呢 ? 我 们 先 来 看 堆 的 基本 概念 :与 


算法 


11.1 堆 的 概念 与 算法 
我 们 先 来 了 解 堆 的 概念 ， 然 后 介绍 堆 的 一 些 主要 算法 。 
11.1.1 基本 概念 
ge? 我 人 先 玉 看 罗 一 个 相 记 的 概念， 沽 二 又 枫 “ 沛 又 笠 昌 开除 了 最 


后 一 屋外， 每 个 市 点 都 有 两 个 护 子 ， 而 最 后 一 层 都 症 叶 于 广 护 ， 部 没 
有 孩子 。 比如， 图 11-1 所 示 两 株 二 又 树 都 是 满 二 又 树 。 
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a) b) 
图 11-1 满 二 又 树 示例 
满 二 又 树 一 定 是 完全 二 又 树 ， 但 完全 二 又 树 不 要 求 最 后 一 层 是 满 


的 ， 但 如 采 不 满 ， 则 要 求 所 有 市 点 必须 集中 在 最 左边 ， 从 左 到 右 是 连 
0 中 间 不 能 有 空 的 。 比 如 ， 图 11-2 所 示 几 柠 二 又 树 都 是 完全 二 又 


a) b) c) d) 
图 11-2 ”完全 二 又 树 示例 


而 多 11-3 所 示 的 几 柠 二 又 树 则 都 不 是 完全 二 又 树 。 


a) b) c) 
图 11-3” 非 完全 二 又 树 示例 


在 完全 二 又 树 中 ， 可 以 给 每 个 节点 一 个 编号 ， 编 号 从 1 开始 连续 递 
增 ， 从 上 到 下 ， 从 左 到 右 ， 如 图 11-4 所 示 。 
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图 11-4 完全 二 又 树 编号 


完全 二 叉 树 有 一 个 重要 的 特点 ， 给 定 任意 一 个 节点 ， 可 以 根据 其 
编号 直接 快速 计算 出 其 父 节点 和 孩子 节点 编号 。 如 果 编 号 为 1， 则 父 节 
点 编号 即 为 2， 左 孩子 编号 即 为 2xi， 右 孩子 编号 即 为 2xi+1。 比 如 ， 对 
于 5 号 广 点 ， 父 太 点 为 5/2 即 2， 左 孩子 为 2x5 即 10， 右 孩子 为 2x5+1 即 
11。 


这 个 特点 为 什么 重要 呢 ? 它 使 得 逻辑 概念 上 的 二 叉 树 可 以 方便 地 
存储 到 数组 中 ， 数 组 中 的 元 素 索 引 殊 对 应 节操 的 编号 ， 树 中 的 父 于 关 
系 通过 其 索引 关系 隐 含 维持 ， 不 需要 单独 保持 。 比 如 ， 图 11-4 所 示 的 人 逻 
辑 二 叉 树 ， 保 存 到 数组 中 ， 其 结构 如 图 11-5 所 示 。 


图 11-5 ”用 数组 表示 完全 二 又 树 


”父子 关系 是 隐 侣 的 ， 比 如 对 于 第 5 个 元 素 13， 其 父 斑 点 就 是 第 2 个 
元 素 15， 左 孩子 驶 是 第 10 个 元 素 7， 右 孩子 就 是 第 11 个 元 素 4。 


这 种 存储 二 又 树 的 方法 与 之 前 介绍 的 TreeMap 是 不 一 样 的 。 在 
TreeMap 中 ， 有 一 个 单独 的 内 部 类 Entry，Entry 有 三 个 引用 ， 分 别 指向 
父 节 点 、 左 骇 子 、 右 孩子 。 使 用 数组 存储 的 优点 是 忆 省 空间 ， 而 且 访 
问 效率 高 。 堆 逻辑 概念 上 是 一 棵 完全 二 又 树 ， 而 物理 存储 上 使 用 数 
组 ， 还 有 一 定 的 顺序 要 求 。 


之 前 介绍 过 排序 二 又 树 。 排 序 二 又 树 是 完全 有 序 的 ， 每 个 节点 都 

有 确定 的 前 驱 和 和 后继， 而且 不 能 有 重复 元 素 。 与 排序 二 又 树 不 同 ， 在 

堆 中 ， 可 以 有 重复 元 素 ， 元 素 间 不 是 完全 有 序 的 ， 但 对 于 父子 节点 之 

= 。 根据 顺序 分 为 两 种 扒 : 一 种 是 最 大 堆 ， 男 一 
是 最 小 o 


最 大 堆 是 指 每 个 证 护 都 不 大 于 其 父 休 点 。 这 样 ， 对 每 个 父 市 所 ， 
一 定 不 小 于 其 所 有 护 子 广 态 ， 而 根 广 点 束 古 所 及 上 护 中 最 大 的 ， 对 每 
个 子 树 ， 子 树 的 根 也 十 子 树 所 有 广 扣 中 最 大 的 。 最 小 堆 与 最 大 堆 正 好 
相反 ， 每 个 节操 者 不 小 于 其 父 太 后 。 这 样 ， 对 每 个 父 节 点 ， 一 定 不 大 
于 其 所 有 孩子 万 点 ， 而 根 世 点 束 是 所 有 世 点 中 最 小 的 ， 对 每 个 子 树 ， 
子 树 的 根 也 是 子 树 所 有 市 点 中 最 小 的 。 我 们 看 个 例子 ， 如 图 11-6 所 示 。 


总 结 来 说 ， 逻 辑 概念 上 ， 堆 是 完全 二 又 树 ， 父 子 节 点 间 有 特定 顺 
序 ， 分 为 最 大 堆 和 最 小 堆 ， 最 大 堆 根 是 最 大 的 ， 最 小 堆 根 是 最 小 的 ， 
堆 使 用 数组 进行 物理 存储 。 


为 什么 堆 可 以 高 效 地 解决 之 前 我 们 说 的 问题 呢 ? 在 回答 之 前 ,我 
们 和 需要 先 看 下 ， 如 何在 堆 上 进行 数据 的 基本 操作 ， 在 操作 过 程 中 如 何 
保持 堆 的 属性 不 变 。 
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a) 最 大 堆 b) 最 小 堆 


图 11-6 ”最 大 堆 与 最 小 堆 示 例 


TTL2 挫 的 算法 


下 和 面 ， 我 们 介绍 如 何在 堆 上 进行 数据 的 基本 操作 。 最 大 堆 和 最 小 
扒 的 算法 是 类 似 的 ， 我 们 以 最 小 堆 来 说 明 。 移 来 看 如 何 添加 元 素 。 


1. 添 加 元 素 


如 琳 堆 为 空 ， 则 直接 深 加 一 个 根 殊 行 了 。 我 们 假定 已 经 有 一 个 
堆 ， 要 在 其 中 深 加 元 素 ， 基 本 步 又 为 : 

1) 添加 元 素 到 最 后 位 置 。 

2) 与 父 节 反比 较 ， 如 琳 大 于 等 于 父 记 点 ， 则 满足 堆 的 性 质 ， 结 
束 ， 否 则 与 父 节 后 进行 交换 ， 然 后 再 与 父 方太 比较 和 交换 ， 直 到 父 市 
尽 为 空 或 者 大 于 等 于 父 节 抬 。 

我 们 来 看 个 例子 。 岁 11-7 坪 添加 元 素 前 的 初始 结构 。 
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图 11-7 堆 的 算法 示例 :添加 元 妈 前 的 初始 结构 
深 加 元 素 3， 第 一 步 后 ， 结 构 如 图 11-8 所 示 。 


图 11-8 堆 的 算法 示例 : 舌 加 元 系 3 第 一 步 后 的 结构 


3 小 于 父 节 点 8， 不 满足 最 小 堆 的 性 质 ， 所 以 与 父 节 点 交换 ， 变 为 
图 11-9 所 示 。 


交换 后 ，3 还 是 小 于 父 亡 点 6， 所 以 继续 交换 ， 变 为 图 11-10 所 示 。 


交换 后 ，3 还 是 小 于 父 节 后， 也 是 根 广 点 4， 继 续 交 换 ， 变 为 图 11- 
11 所 示 。 
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图 11-9 堆 的 算法 示例 : 添加 元 聚 3 第 一 次 交换 后 的 结构 
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图 11-11 堆 的 算法 示例 : 添加 元 素 3 第 三 次 交换 后 的 结构 
至 此 ， 调 整 结束 ， 树 保持 了 堆 的 性 质 。 
从 以 上 过 程 可 以 看 出 ， 添 加 一 个 元 素 ， 需 要 比较 和 交换 的 次 数 最 
多 为 树 的 高 度 ， 即 log2 (N) ，N 为 世 点 数 。 这 种 自 底 向 上 比较 、 交 
换 ， 使 得 树 重新 满足 堆 的 性 质 的 过 程 ， 我 们 称 为 向 上 调整 (siftup) 


2. 从 头 部 删除 元 又 


在 队列 中 ， 一 般 是 从 头 部 删除 元 素 ，Java 中 用 扒 实 现 优先 级 队列 。 
下 面 介绍 如 何在 堆 中 删除 头 部 ， 其 基本 步骤 为 : 


1) 用 最 后 一 个 元 聚 殖 换 头 部 元 率 ， 并 删 挥 最 后 一 个 元 素 ; 

2) 将 新 的 头 部 与 两 个 孩子 节点 中 较 小 的 比较 ， 如 果 不 大 于 该 孩子 
节操， 则 满足 堆 的 性 质 ， 结 束 ， 否 则 与 较 小 的 孩子 节 扩 进行 交换 ， 交 
换 后 ， 再 与 较 小 的 孩子 节点 比较 和 交换 ， 一 直到 没有 孩子 节点 ， 或 者 
不 大 于 两 个 孩子 万 点 。 这 个 过 程 称 为 向 下 调整 (siftdown) 。 

我 们 来 看 个 例子 。 图 11-12 是 删除 元 素 前 的 初始 结构 。 


执行 第 一 步 ， 用 最 后 元 素 蔡 换 头 部 ， 如 图 11-13 所 示 。 
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图 11-12” 堆 的 算法 示例 :删除 元 素 前 的 初始 结构 


图 11-13” 堆 的 算法 示例 : 删除 头 部 元 素 第 一 步 后 的 结构 


现在 根 季 点 16 大 于 孩子 节点 ， 与 更 小 的 孩子 和 点 6 进行 替换 ， 结 构 
变 为 图 11-14 所 示 。 


”16 还 是 大 于 孩子 T 点 ， 与 更 小 的 孩子 8 进行 交换 ， 结 构 如 岁 11-15 所 
示 。 
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图 11-14 ” 堆 的 算法 示例 ， 删 除 头 部 元 素 第 一 次 交换 后 的 结构 
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i。 区 各 详 加 
图 11-15” 堆 的 算法 示例 :删除 头 部 元 素 第 二 次 交换 后 的 结构 
至 此 ， 就 满足 堆 的 性 质 了 。 
3. 从 中 间 删 除 元 素 


7 8 9 10 
13: 2, 生 记 :对 


那 如 有 果 需 要 从 中 间 删 除 菜 个 市 点 呢 ? 与 从 头 部 删除 一 样 ， 都 是 移 
用 最 后 一 个 元 素 蕉 换 待 删 元 素 。 不 过 蔡 换 后 ， 有 两 种 情况 .如果 该 元 
素 大 于 某 孩 子 节 点 ， 则 需 向 下 调整 (sift-down) ; 如 果 小 于 父 刷 点 ， 则 
需 向 上 调整 (siftup) 。 


我 们 来 看 个 例子 ， 删 除 值 为 21 的 节 上 后， 第 一 步 如 图 11-16 所 示 。 


替换 后 ，6 没 有 子 节 点 ， 小 于 父 节 点 12， 执 行 网 上 调整 (siftup) 过 
程 ， 最 后 结果 如 图 11-17 所 示 。 


我 们 再 来 看 个 例 于 ， 删 除 值 为 9 的 万 点 ， 第 一 步 如 图 11-18 所 示 。 


交换 后 ，11 大 于 右 孩 子 10， 所 以 执行 癌 下 调整 (siftdown) 过 程 ， 
执行 结束 后 如 图 11-19 所 示 。 
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图 11-16 ” 堆 的 算法 示例 : 从 中 间 删 除 元 素 21 第 一 步 后 的 结构 
4. 构 建 初始 堆 


给 定 一 个 无 序数 组 ， 如 何 使 之 成 为 一 个 最 小 堆 呢 ? 将 普通 无 序数 
组 变 为 堆 的 过 程 称 为 heapify。 基 本 思路 是 : 从 最 后 一 个 非 叶 子玉 点 开 
始 ， 一 直 往 前 直到 根 ， 对 每 个 节点 ， 执 行 向 下 调整 (siftdown) 。 换 名 
话说 ， 是 目 故 同上 ， 先 使 每 个 最 小 于 树 为 堆 ， 然 后 每 对 左右 子 树 和 其 
父 太 点 合并 ， 调 整 为 更 大 的 堆 ， 因 为 每 个 子 树 已 经 为 堆 ， 所 以 调整 环 
是 对 父 节 反 执 行 向 下 调整 (siftdown) ， 这 样 一 直 合 并 调整 直到 根 。 这 
个 算法 的 仿 代 码 是 : 


人 
图 11-17 ” 堆 的 算法 示例 : 从 中 间 删 除 元 素 21 调 整 后 的 结构 
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图 11-18 扒 的 算法 示例 : 从 中 间 删 除 元 素 9 第 一 步 后 的 结构 


void heapify() { 
for(int i=size/2; i >= 1; i--) 
Siftdown( 工 ) ; 


} 


size 表 示 节 扩 个 数 ， 市 扩编 号 从 1 开始 ，size/2 表 示 第 一 个 非 叶 子 市 
点 的 编号 。 


这 个 构建 的 时 间 效 率 为 O (N) ，N 为 节点 个 数 ， 具 体 就 不 证 明 
了 了 。 


a De 上 
ye 
12 和 5 13 


图 11-19 堆 的 算法 示例 : 从 中 间 删 除 元 素 9 调整 后 的 结构 
5. 碍 找 和 允 历 


在 堆 中 进行 查找 没有 特殊 的 算法 ， 就 是 从 数组 的 头 找 到 尾 ， 效 率 
为 O (N) 。 

在 堆 中 进行 遍历 也 是 类 似 的 ， 堆 就 是 数组 ， 堆 的 遍历 就 是 数组 的 
， 第 一 个 元 素 是 最 大 值 或 最 小 值 ， 但 后 面 的 元 素 没有 特定 的 顺 
予 O 


需要 说 明 的 是 ， 如 果 是 逐个 从 头 部 删除 元 素 ， 那 么 堆 可 以 确保 输 
出 是 有 序 的 。 


6. 算 法 小 结 

以 上 束 古 堆 操作 的 主要 算法 ， 小 结 如 下 。 

1) 在 添加 和 删除 元 素 时 ， 有 两 个 关键 的 过 程 以 保持 堆 的 性 质 ， 一 
个 是 向 上 调整 (siftup) ， 男 一 个 是 向 下 调整 (siftdown) ， 它 们 的 效率 


都 为 O(log。 (N) ) 。 由 无 序数 组 构建 堆 的 过 程 heapify 是 一 个 目的 癌 
上 循环 的 过 程 ， 效 率 为 O (N) 。 


2) 查找 和 侦 历 就 是 对 数组 的 查找 和 人 遍 历 ， 效 率 为 O(N) 。 


11.1.3 小 绪 


本 市 介绍 了 堆 这 一 数据 结构 的 基本 概念 和 算法 。 堆 古 一 种 比较 神 
奇 的 数据 结构 ， 概 念 上 是 树 ， 存 储 为 数组 ， 父 子 有 特殊 顺序 ， 根 是 最 
大 值 /最 小 值 ， 构 建 /添加 /删除 效率 都 很 高 ， 可 以 高 效 解决 很 多 问题 。 
但 在 Java 中 ， 堆 到 瓜 是 如 何 实现 的 呢 ? 本 章 开头 提 到 的 那些 问题 ， 用 堆 
到 撒 如 何 解决 呢 ? 让 我 们 在 接 下 来 的 小 节 中 继续 探讨 。 


11.2” 襄 析 PriorityQueue 


本 节 探 讨 堆 在 Java 中 的 具体 实现 类 : PriorityQueue。 顾名思义 ， 
PriorityQueue 是 优先 级 队列 ， 它 首先 实现 了 队列 接口 (Queue) ， 与 
LinkedList 类 似 ， 它 的 队列 长 度 也 没有 限制 ， 与 一 般 队 列 的 区 别 是 ， 它 
有 优先 级 的 概念 ， 每 个 元 素 都 有 优先 级 ， 队 头 的 元 素 永远 都 是 优先 级 


最 高 的 。 


PriorityQueue 内 部 是 用 堆 实现 的 ， 内 部 元 素 不 是 完全 有 序 的 ， 不 
过 ， 逐 个 出 队 会 得 到 有 序 的 输出 。 虽 然 名 字 叫 优先 级 队列 ， 但 也 可 以 
将 PriorityQueue 看 作 一 种 比较 通用 的 实现 了 堆 的 性 质 的 数据 结构 ， 可 
以 用 PriorityQueue 来 解决 适合 用 堆 解 决 的 问题 ， 下 一 小 市 我 们 会 来 看 
一 些 具 体 的 例子 。 下 面 ， 我 们 先 介绍 其 用 法 ， 接 着 分 析 实 现代 码 ， 最 
后 总 结 分 析 其 特点 。 


11.2.1 基本 用 法 


PriorityQueue 实 现 了 Queue 接 口 ， 我 们 在 LinkedList 一 方 介绍 过 
Queue， 为 便于 阅读 ， 这 里 重复 下 其 定义 : 


public interface Queue<E> extends Collection<E> { 
boolean add(E e); // 在 尾部 添加 元 素 ， 队 列 满 时 抛 异 党 
boolean offer(E e); // 在 尾部 添加 元 素 ， 队 列 满 时 返回 false 
E remove( ); // 删 除 头 部 元 素 , 队列 空 时 抛 异常 
E poll(); // 删 除 头 部 元 素 ， 队 列 空 时 返 
E element(); // 查 看 头 部 元 素 , 队列 空 时 
E peek(); // 碍 看 头 部 元 素 ， 队 列 空 时 返 
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PriorityQueue 有 多 个 构造 方法 ， 部 分 构造 方法 如 下 所 示 : 


public PriorityQueue() 
public PriorityQueue(int initialCapacity, Comparator<? super E> comparator) 
public PriorityQueue(Collection<? extends E> c) 


PriorityQueue 是 用 堆 实 现 的 ， 堆 物理 上 就 是 数 组 ， 与 ArrayList 类 
似 ，PriorityQueue 同 样 使 用 动态 数组 ， 根 据 元 素 个 数 动态 扩展 ， 


initialCapacity 表 示 初 始 的 数组 大 小 ， 可 以 通过 参数 传 入 。 对 于 默认 构 
造 方法 ，initialCapacity 使 用 默认 值 11。 对 于 最 后 的 构造 方法 ， 数 组 大 
小 等 于 参数 容器 中 的 元 素 个 数 。 与 TreeMap/TreeSet 类 似 ， 为 了 保持 一 
定 顺序 ，PriorityQueue 要 求 要 么 元 素 实现 Comparable 接 口 ， 要 么 传递 
一 个 比较 器 Comparator 。 


我 们 来 看 个 基本 的 例子 : 


QUueue<Integer> pq = new PriorityQueue<>(); 
pq.offer(10); 
pq.add(22); 
pq.addAll(Arrays.asList(new Integer[]{ 

11, 12, 34, 2, 7, 4, 15, 12, 8, 6, 19, 13 })); 
while(pq.peek()!=nul]l){ 

System.out.print(pq.pol1() + " "); 
} 


代码 很 简单 ， 添 加 元 素 ， 然 后 逐个 从 头 部 删除 ， 与 普通 队列 不 
同 ， 输 出 钙 从 小 到 大 有 序 的 : 


2467 8 10 11 12 12 13 15 19 22 34 


如 果 希 望 是 从 大 到 小 昵 ?传递 一 个 逆序 的 Comparator， 将 第 一 行 
代码 蔡 换 为 : 


Queue<Integer> pq = new PriorityQueue<>(11, Collections.reverseOrder()); 
2 [HI 关上- 全 2 也 > 
输出 殉 会 变 为 : 


34 22 19 15 13 12 12 11 10 87 6 4 2 


我 们 再 来 看 个 例子 。 模 拟 一 个 任务 队列 ， 定 义 一 个 内 部 类 Task 表 
示人 性 秀 ; 如 下 及 示 : 


static class Task { 
int priority; 
String name; 


/ 
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省 略 构造 方法 和 getter 方 法 


Task 有 两 个 实例 变量 : priority 表 示 优 先 级 ， 值 越 大 优先 级 越 高 ; 
name 表 示 任 务 名 称 。Task 没 有 实现 Comparable， 我 们 定义 一 个 单独 的 
静态 成 员 taskComparator 表 示 比 较 絮 ， 如 下 所 示 : 


private static Comparator<Task> taskComparator = new Comparator<Task>() { 
QOverride 
public int compare(Task o1, Task 02) { 
if(o1.getPriority()>o2.getPriority()){ 
return -1; 
}else if(ol.getPriority()<o2.getPriority()){ 
return 1; 


return 0) 


}; 


下 面 来 看 任务 队列 的 示例 代码 : 


Queue<Task> tasks = new PriorityQueue<Task>(11, taskComparator); 
tasks.offer(new Task(20, " 写 日 记 ")); 
tasks .offer(new Task(10,， "看 电视 ")); 
tasks.offer(new Task(100," 写 代码 ")); 
Task task = tasks.poll(); 
while(task!=null){ 

System,out,print(" 处 理 任务 : "+task.getName() 

+"， 优 先 级 : "+task.getPriority()+"\n"); 
task = tasks.poll(); 


代码 很 价 单 ， 束 不 解释 了 ， 和 输出 任务 按 优 移 级 排列 : 


处 理 任务 : 写 代 码 ， 优 先 级 :100 
处 理 任务 : 写 日 记 ， 优 先 级 :20 
处 理 任务 : 看 电视 ， 优 先 级 :10 


11.2.2 ”实现 原理 


理解 了 PriorityQueue 的 用 法 和 特点 ， 我 们 来 看 其 具体 实现 代码 
(基于 Java 7) ， 从 内 部 组 成 开始 。 内 部 有 如 下 成 员 : 


private transient Object[] queue 

private int size = 0) 

private final Comparator<? super E> Comparator ， 
private transient int modCount = 0,; 


queue 束 是 实际 存储 元 素 的 数组 。size 表 示 当 前 元 素 个 数 。 
comparator 为 比较 器 ， 可 以 为 null。modCount 记 录 修 改 次 数 ， 在 介绍 第 
一 个 容器 类 ArrayList 时 已 介绍 过 。 


如 何 实现 各 种 操作 ， 且 保持 堆 的 性 质 呢 ? 我 们 来 看 代码 ， 从 基本 
构造 方法 开始 。 


几 个 基本 构造 方法 的 代码 是 : 


public PriorityQueue() { 
this(DEFAULT_INITIAL CAPACITY, null); 


public PriorityQueue(int initialCapacity) { 
this(initialCapacity, null); 


public PriorityQueue(int initialCapacity, 
Comparator<? super E> comparator) { 
if(initialCapacity < 1) 
throw new IllegalArgumentException(); 
this.queue = new Object[initialCapacity]; 
this.comparator = Comparator ， 


代码 很 简单 ， 束 是 初始 化 了 queue 和 comparator。 下 面 介 绍 一 些 操 
作 的 代码 ， 大 部 分 的 算法 和 图 示 我 们 在 11.1 广 已 经 介绍 过 了 。 


添加 元 素 入 队 ) 的 代码 如 下 所 示 ， 我 们 添加 了 一 些 注释 : 


public boolean offer(E e) { 

if(e == null) 
throw new NullPpointerException(); 

modCount++; 

int i = size; 

if(i >= queue.length) // 首 先 确 保 数 组 长 度 是 够 的 ， 如 果 不 够 ， 调 用 grow 方 法 动态 扩展 
grow(i + 1); 

size = i + 1; // 增 加 长 度 


if(i == 0) // 如 果 是 第 一 次 添加 ， 直 接 添加 到 第 一 个 位 置 即 可 
queue[0] = e; 
else // 否 则 将 其 放 入 最 后 一 个 位 置 ， 但 同时 向 上 调整 (siftUp) ， 直 至 满足 堆 的 性 质 


siftUp(i, e); 
return true; 


有 两 步 复杂 一 些 ， 一 步 是 grow， 男 一 步 是 siftUp， 我 们 来 细 看 
下 。grow () 方法 的 代码 为 : 


private void grow(int minCapacity) { 

int oldCapacity = queue.length,; 

// Double size if small; else grow by 50% 

int newCapacity = oldCapacity + ((oldCapacity < 64) 
(oldCapacity + 2) : 
(oldcCapacity >> 1)); 

// overflow-conscious code 

if(newCapacity - MAX_ARRAY_SIZE > 0) 

newCapacity = hugeCapacity(minCapacity); 
dueue = Arrays,copyof(queue，newCapacity ) ， 


如 有 果 原 长 度 比 较 小 ， 大 概 束 是 扩展 为 两 倍 ， 否 则 就 是 增加 50%， 
使 用 Arrays.copyOf 方 法 复制 数组 。siftUp 的 基本 思路 我 们 在 11.1 和 介绍 
过 了 ， 其 实际 代码 为 : 


private void siftUp(int k, E x) { 
if(comparator != null) 
siftUpUsingComparator(k, x); 
else 
siftUpComparable(k, x); 


. 根据 是 否 有 comparator 分 为 了 两 种 情况 ， 代 码 类 似 ， 我 们 只 看 一 


private void siftUpUsingComparator(int k, E x) { 
while(k > 0) { 
int parent = (k - 1) >>> 1; 
Object e = queue[parent]; 
if(comparator.compare(x, (E) e) >= 0) 
break; 
queue[k] = e; 
k = parent ， 


queue[k] = x; 


参数 k 表 示 捅 入 位 置 ，x 表 示 新 元 宗 。k 初 始 等 于 数组 大 小 ， 即 在 最 
后 一 个 位 置 插入 。 代 码 的 主要 部 分 是 ， 往 上 寻找 x 真正 应 该 插入 的 位 
置 ， 这 个 位 置 用 k 表 示 。 


怎么 找 呢 ? 新 元 素 (x) 不 断 与 父 届 点 (e) 比较 ， 如 果 新 元 素 
(x) 大 于 等 于 父 忆 点 (e) ， 则 已 满足 堆 的 性 质 ， 退 出 循环 ，k 就 是 新 
元 素 最 终 的 位 置 ， 否 则 ， 将 父 忆 点 往 下 移 (queue[k]=e) ， 继 续 向 上 
寻找 。 这 与 11.1 节 介绍 的 算法 和 图 示 是 对 应 的 。 


查看 头 部 元 聚 的 代码 为 : 


public E peek() { 
if(size == 0) 
return null; 
return (E) queue[0]; 


忠 古 返回 第 一 个 元 素 。 
删除 头 部 元 素 (出 队 ) 的 代码 为 : 


public E poll() { 
if(size == 0) 
return null; 
int s = --size,; 
modCount++， 
E result = (E) queue[0]; 
E x = (E) queue[s]; 
queue[s] = null; 
if(s != 0) 
siftDown(©0, x); 
return result; 


返回 结果 result 为 第 一 个 元 素 ，x 指 癌 最 后 一 个 元 素 ， 将 最 后 位 置 
设置 为 null (queue[s]=null) ， 最 后 调用 siftDown 将 原来 的 最 后 元 素 x 插 
入 头 部 并 调整 堆 ，siftDown 的 代码 为 : 


private void siftDown(int k, E x) { 
if(comparator != null) 
siftDownUsingComparator(k, x); 
else 
siftDownComparable(k, x); 


同样 分 为 两 种 情况 ， 代 码 类 似 ， 我 们 只 看 一 种 : 


private void siftDownComparable(int k, E x) { 
Comparable<? super E> key = (Comparable<? super E>)x; 
int half = size >>> 1; //loop while a non-leaf 
while(k < half) { 
int child = (k << 1) + 1; //assume left child is least 
Object c = queue[child]; 
int right = child + 1; 
if(right < size && 
((Comparable<? super E>) c).compareTo((E) queue[right]) > 0) 
c = queue[child = right]; 
if(key.compareTo((E) c) <= 0) 


break; 
queue[k] = c; 
k = child; 


} 
queue[k] = key; 


k 表 示 最 终 的 插入 位 置 ， 初 始 为 0，x 表 示 原 来 的 最 后 元 素 。 代 码 的 
主要 部 分 是 : 同 下 寻找 x 真正 应 该 搬入 的 位 置 ， 这 个 位 置 用 k 表 示 。 


怎么 找 呢 ? 新 元 素 key 不 断 与 较 小 的 孩子 节点 比较 ， 如 果 小 于 等 于 
较 小 的 孩子 节点 ， 则 已 满足 堆 的 性 质 ， 退 出 循环 ，k 就 是 最 终 位 置 ， 否 
则 将 较 小 的 孩子 节点 往 上 移 ， 继 续 向 下 寻找 。 这 与 11.1 节 介绍 的 算法 
和 图 示 也 是 对 应 的 。 

解释 下 其 中 的 一 些 代码 ; 


1) k<half 表 示 编 号 为 k 的 节点 有 孩子 节点 ， 没 有 孩子 万 点 ， 就 不 
需要 继续 找 了 : 


2) child 表 示 较 小 的 孩子 节点 编号 ， 初 始 为 左 孩 子 ， 如 果 有 右 孩 子 
(编号 right) 且 小 于 左 孩 子 则 child 会 变 为 right; 


3) c 表 示 较 小 的 孩子 节点 。 
根据 值 删除 元 素 的 代码 为 : 


public boolean remove(Object o) { 
int i = indexof(o); 
if(i == -1) 
return false,; 
else { 
removeAt (i); 
return true; 
} 
} 


人 查找 元 素 的 位 置 h1， 然 后 调用 removeAt 埋 行 删 除 ，removeAt 的 代 
码头 


private E _ removeAt(int i) { 
assert i >= 0 && i < size,; 
modCount++， 
int s = --size,; 
if(s == i) // removed last element 
queue[i] = null; 
else { 
E moved = (E) queue[s]; 
queue[s] = null; 
siftDown(i, moved ) ， 
if(queue[i] == moved) { 
SiftUp(I，moved ) 
If(dqueue[I] != moved ) 
return moved,; 


} 


return null; 


如 果 是 删除 最 后 一 个 位 置 ， 直 接 删 即 可 ， 否 则 移动 最 后 一 个 元 素 
到 位 置 i 并 进行 堆 调整 ， 调 整 有 两 种 情况 ， 如 果 大 于 孩子 节点 ， 则 加 下 
调整 ， 否 则 如 果 小 于 父 节 点 则 同上 调整 。 代 人 码 先 回 下 调整 (siftDown 
(i, ed ) ， 如 果 没 有 调整 过 (queue[li]==moved) ， 可 能 需 向 上 
调整 ， 调 用 siftUp 5 moved) 。 如 果 癌 上 调整 过 ， 返回 值 为 moved 
其 他 情况 返回 null， 这 个 主要 用 本 送 代 妖 的 删除 
方法 ， 送 代 妖 的 细 太 我 们 就 不 介绍 了 。 


如 果 从 一 个 既 不 是 PriorityQueue 也 不 是 SortedSet 的 容 絮 构造 堆 ， 
代码 为 : 


private void initFromCollection(Collection<? extends E> c) { 
initElementsFromCollection(c); 
heapify( ); 


initElementsFromCollection 的 主要 代码 为 : 


private void initElementsFromCollection(Collection<? extends E> c) { 
Object[] a = c.toArray(); 
if(a.getclass() != Object[].class) 
a = Arrays.copyof(a, a.length, Object[].class),; 


this ， queue = a; 
this.size = a. length; 


} 
主要 是 初始 化 queue 和 size。heapify 的 代码 为 : 


private void heapify() { 
for(int i = (Size >>> 1) - 1; i >= 0) i--) 
siftDown(i, (E) queue[i]); 
} 


与 之 前 算法 一 样 ，heapify 也 在 11.1 节 介绍 过 了 ， 就 是 从 最 后 一 个 
非 叶 子 厄 点 开始 ， 目 的 向 上 合并 构建 堆 。 如 果 构 造 方法 中 的 参数 是 
PriorityQueue 或 SortedSet， 则 它们 的 toArray 方 法 返回 的 数组 就 是 有 了 序 
的 ， 残 满足 堆 的 性 质 ， 就 不 需要 执行 heapify 了 。 


11.2.3 小钱 
本 节 介 绍 了 Java 中 堆 的 实现 类 PriorityQueue， 它 实现 了 队列 接口 
Queue， 但 按 优先 级 出 队 ， 内 部 是 用 堆 实 现 的 ， 有 如 下 特点 : 


I 最 先 出 队 的 总 是 优先 级 最 高 的 ， 即 排序 中 
I 第 一 个 。 

2) 优先 级 可 以 有 相同 的 ， 内 部 元 素 不 是 完全 有 序 的 ， 如 果 遍 历 输 
出 ， 除 了 第 一 个 ， 其 他 没有 特定 顺序 。 


3) 查看 头 部 元 素 的 效率 很 高 ， 为 O (1) ， 入 队 、 革 队 效率 比较 
高 ， 为 O (log。 (N) ) ， 构建 堆 heapify 的 效率 为 O(N (N) 


4) 根据 值 查找 和 删除 元 素 的 效率 比较 低 ， 为 O(N) 。 
除了 用 作 基 本 的 优先 级 队列 ，PriorityQueue 还 可 以 作为 一 种 比较 
通用 的 数据 结构 ， 用 于 解决 一 些 其 他 问题 ， 让 我 们 在 下 一 节 继 续 探 


讨 。 


11.3” 堆 和 PriorityQueue 的 应 用 


PriorityQueue 除 了 用 作 优 先 级 队列 ， 还 可 以 用 来 解决 一 些 别 的 问 
题 ， 本 章 开 头 提 到 了 如 下 两 个 应 用 。 

1) 求 前 K 个 最 大 的 元 素 ， 元 素 个 数 不 确 定 ， 数 据 量 可 能 很 大 ， 其 
至 源源 不 断 到 来 ， 但 需要 知道 到 目前 为 止 的 最 大 的 前 K 个 元 素 。 这 个 问 
~ 求 前 K 个 最 小 的 元 素 ， 求 第 K 个 最 大 的 元 素 ， 求 第 K 个 最 
小 的 元 素 。 


2) 求 中 值 元 素 ， 中 值 不 是 平均 值 ， 而 是 排序 后 中 间 那 个 元 素 的 
值 ， 同 样 ， 数 据 量 可 能 很 大 ， 甚 至 源源 不 断 到 来 。 


本 市 ， 我 们 束 来 探讨 如 何 解 决 这 两 个 问题 。 


11.3.1 求 前 K 个 最 大 的 元 素 


一 个 简单 的 思路 是 排序 ， 排 序 后 取 最 大 的 K 个 就 可 以 了 ， 排 序 可 以 
使 用 Arrays.sort () 方法 ， 效 率 为 O (Nxlog。 (N) ) 。 不 过 ， 如 果 K 很 
小 ， 比 如 是 1， 就 是 取 最 大 值 ， 对 所 有 元 素 完 全 排序 是 训 无 必要 的 。 另 
一 个 徐 单 的 思路 是 选择 ， 循 环 选择 KK 次， 每 次 从 剩 下 的 元 素 中 选择 最 大 
值 ， 这 个 效率 为 O(NxK) ， 如 果 K 的 值 大 于 log， (N) ， 这 个 就 不 如 
完全 排序 了 。 


不 过 ， 这 两 个 思路 都 假定 所 有 元 素 都 是 已 知 的 ， 而 不 是 动态 添加 
的 。 如 有 条 元 系 个 数 不 确 定 ， 且 源源 不 断 到 来 呢 ? 


一 个 基本 的 思路 是 维护 一 个 长 度 为 K 的 数组 ， 最 前 面 的 K 个 元 素 就 
征 目前 最 大 的 K 个 元 素 ， 以 后 每 来 一 个 者 元 素 的 时 候 ， 都 和 爷 找 数组 中 的 
最 小 值 ， 将 新 元 素 与 最 小 值 相 比 ， 如 果 小 于 最 小 值 ， 则 什么 都 不 用 
变 ， 如 有 果 大 于 最 小 值 ， 则 将 最 小 值 奉 换 为 新 元 素 。 


这 有 点 类 似 于 生活 中 的 末 位 淘汰 ， 新 元 素 与 原来 最 末尾 的 比 即 
可， 要 么 不 如 最 末尾 ， 上 不 去 ， 要么 蔡 挥 原来 的 末尾 。 


这 样 ， 数 组 中 维护 的 永远 是 最 大 的 K 个 元 素 ， 而 且 不 管 源 数据 有 多 
少 ， 需 要 的 内 存 开销 是 固定 的 ， 束 是 长 度 为 K 的 数组 。 不 过 ， 呈 米 一 个 
都 需要 找 最 小 值 ， 都 需要 进行 K 次 比较 ， 能 不 能 减少 比较 次 数 
史 ? 


解决 方法 是 使 用 最 小 扒 维 护 这 K 个 元 素 ， 最 小 堆 中 ， 根 即 第 一 个 元 
素 永 远 都 是 最 小 的 ， 新 来 的 元 素 与 根 比 束 可 以 了 ， 如 采 小 于 根 ， 则 堆 
不 需要 变化 ， 否 则 用 新 元 素 蔡 换 根 ， 然 后 向 下 调整 堆 即 可 ， 调 整 的 效 
率 为 0 (log。 (K) ) ， 这样， 总 体 的 效率 就 是 O (Nxlog。 (K) ) 

这 个 效率 非常 高 ， 而 且 存 储 成 本 也 很 低 。 


使 用 最 小 扒 之 后 ， 第 K 个 最 大 的 元 系 也 很 容易 获得 ， 它 殉 是 堆 的 


理解 了 思路 ， 下 面 我 们 来 看 代码 。 我 们 实现 一 个 简单 的 TopK 类 ， 
如 代码 清单 11-1 所 示 。 


代码 清单 11-1 求 前 K 个 最 大 的 元 素 : TopK 


public class TopK <E> { 
private PriorityQueue<E> p; 
private int k; 
public TopK(int k){ 
this.k = k; 
this.p = new PriorityQueue<>(k); 


} 
public void addAll(Collection<? extends E> c){ 
for(E e : c)t{ 
add(e); 


} 
public void add(E e) { 
if(p.size()<k)t{ 
p.add(e); 
return; 


Comparable<? super E> head = (Comparable<? super E>)p.peek(); 
if(head.compareTo(e)>0){ 

// 小 于 TopK 中 的 最 小 值 ， 不 用 变 

return; 


} 

// 新 元 素 蔡 换 掉 原 来 的 最 小 值 成 为 TopK 之 一 
p.poll(); 

p.add(e); 


} 
public <T> T[] toArray(T[] a)t{ 
return p.toArray(a); 


} 
public E getkth(){ 


return p.peek(); 


我 们 稍微 解释 一 下 。TopK 内 部 使 用 一 个 优先 级 队列 和 k， 构 造 方法 
接受 一 个 参数 k， 使 用 PriorityQueue 的 默认 构造 方法 ， 假 定 元 素 实 现 了 
Comparable 接 口 。 

add 方 法 实现 同 其 中 动态 添加 元 素 ， 如 果 元 素 个 数 小 于 k 直 接 添 
加 ， 人 否则 与 最 小 值 比较 ， 只 在 大 于 最 小 值 的 情况 下 潜 加 ， 添 加 前 ， 苑 
删 掉 原来 的 最 小 值 。addAll 方 法 循环 调用 add 方 法 。 


toArray 方 法 返回 当前 的 最 大 的 K 个 元 素 ，getKth 方 法 返回 第 K 个 最 
大 的 元 素 。 


我 们 来 看 一 下 使 用 的 例子 : 


Topk<Integer> top5 = new TopKk<>(5); 
top5.addAll(Arrays.asList(new Integer[]{ 

100, 1, 2, 5, 6, 7, 34, 9, 3, 4, 5, 8, 23, 21, 90, 1, 0 
})); 


System.out.printin(Arrays.toString(top5.toArray(new Integer[0]))); 
System.out.printin(top5.getkth()); 


保留 5 个 最 大 的 元 系 ， 输 出 为 : 


[21，23，34，100，90] 
21 


代码 比较 商 单 ， 束 不 解释 了 。 


11.3.2 求 中 值 


中 值 丈 是 排序 后 中 间 那 个 元 素 的 值 ， 如 有 果 元 素 个 数 为 奇数 ， 中 值 
征 没有 上 攻 义 的 ， 但 如 果 羡 偶数 ， 中 值 可 能 有 不 同 的 定义 ， 可 以 为 偶 小 
的 那个 ， 也 可 以 是 偏 大 的 那个 ， 或 者 两 者 的 平均 值 ， 或 者 任意 一 个 ， 
这 里 ， 我 们 假定 任意 一 个 都 可 以 。 


一 个 简单 的 思路 是 排序 ， 排序 后 取 中 间 那 个 值 就 可 以 了 ， 排序 可 
以 使 用 Arrays.sort () 方法 ， 效 率 为 O (Nxlog。 (N) ) 


不 过 ， 这 要 求 所 有 元 素 都 是 已 知 的 ， 而 不 是 动态 添加 的 。 如 采 元 
素 源源 不 断 到 来 ， 如 何 实 时 得 到 当前 已 经 输入 的 元 素 序 列 的 中 位 数 ? 


可 以 使 用 两 个 堆 ， 一 个 最 大 堆 ， 一 个 最 小 堆 ， 思 路 如 下 。 


1) 假设 当前 的 中 位 数 为 nm， 最 大 堆 维护 的 是 <=m 的 元 素 ， 最 小 堆 
维护 的 是 >=m 的 元 素 ， 但 两 个 扒 都 不 包 侣 m。 


2) 当 新 的 元 于 到 达 时 ， 比 如 为 e， 将 e 与 m 进 行 比较 ， 者 e<=m， 则 
将 其 加 入 最 大 堆 中 ， 人 否则 将 其 加 入 最 小 堆 中 。 
3) 第 2 步 后 ， 如 果 此 时 最 小 堆 和 最 大 堆 的 元 素 个 数 的 差 值 >=2， 则 
2 然后 从 元 素 个 数 多 的 堆 将 根 世 点 移 除 并 赋 
sm? 


我 们 通过 一 个 例子 来 解释 下 。 比 如 输入 元 系 依 次 为 : 


34, 90, 67, 45,1 


输入 第 1 个 元 素 时 ，m 即 为 34。 


Ee 90 大 于 34， 加 入 最 小 堆 ， 中 值 不 变 ， 如 图 11-20 
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图 11-20 求 中 值 ， 输 入 第 2 个 元 素 后 


输入 第 3 个 元 素 时 ，67 大 于 34， 加 入 最 小 堆 ， 但 加 入 最 小 堆 后 ， 
小 堆 的 元 素 个 数 为 2， 需 调整 中 值 和 堆 ， 现 有 中 值 34 加 入 最 大 堆 中 ， 
小 堆 的 根 67 从 最 小 堆 中 删除 并 赋值 给 m， 如 图 11-21 所 示 。 
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图 11-21 求 中 值 ， 输入 第 三 个 元 素 后 


输入 第 4 个 元 素 45 时 ，45 小 于 67， 加 入 最 大 堆 ， 中 值 不 变 ， 如 图 11- 
22 所 示 。 
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图 11-22 求 中 值 ， 输入 第 四 个 元 素 后 


输入 第 5 个 元 素 1 时 ，1 小 于 67， 加 入 最 大 堆 ， 此 时 需 调整 中 值 和 
堆 ， 现 有 中 值 67 加 入 最 小 堆 中 ， 最 大 堆 的 根 45 从 最 大 堆 中 删除 并 赋值 
给 m， 如 图 11-23 所 示 。 
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图 11-23 求 中 值 ， 输入 第 五 个 元 素 后 


理解 了 基本 思路 ， 我 们 来 实现 一 个 简单 的 中 值 类 Median， 如 代码 
清单 11-2 所 示 。 


代码 清单 11-2” 求 中 值 ，Median 


public class Median <E> { 
private PriorityQueue<E> minP; // 最 小 堆 
private PriorityQueue<E> maxP; // 最 大 堆 
private E m; // 当 前 中 值 
public Median( ){ 
this.minpP = new PriorityQueue<>(); 
this.maxP = new PriorityQueue<>(11, Collections.reverseOorder()); 


private int compare(E e, E m){ 
Comparable<? super E> cmpr = (Comparable<? super E>)e; 
return cmpr.compareTo(m); 


} 
public void add(E e){ 
if(m==null1){ // 第 一 个 元 素 
m= e; 
return; 


if(compare(e, m)<=0){ 
// 小 于 中 值 ， 加 入 最 大 堆 
maxP.add(e); 

}elsef 
minp.add(e); 


if(minpP.size()-maxP.size()>=2){ 


// 最 小 堆 元 素 个 数 多 ， 即 大 于 中 值 的 数 多 


// 将 m 加 入 到 最 大 堆 中 ， 然 后 将 最 小 堆 中 的 根 移 除 赋 给 m 
maxP.add(this.m); 
this.m = minP.poll(); 
}else if(maxP.size()-minP.size()>=2){ 
minP.add(this.m); 
this.m = maxP.poll(); 
} 
} 
public void addAll(Collection<? extends E> c){ 


} 

public E getM() { 
return m; 

} 


} 


代码 和 思路 基本 是 对 应 的 ， 比 较 人 简单 ， 束 不 解释 了 。 我 们 来 看 一 
个 使 用 的 例子 : 


Median<Integer> median = new Median<>(); 
List<Integer> list = Arrays.asList(new er 
34, 90, 67, 45, 1, 4, 5, 6, 7, 9, 


}); 
median.addAll(1ist); 
System.out,.println(median,getM( ) )， 


输出 为 中 值 9 。 
11.3.3 小结 


本 方 介绍 了 堆 和 PriorityQueue 的 两 个 应 用 ， 求 前 K 个 最 大 的 元 素 和 
求 中 值 ， 介 绍 了 基本 思路 和 实现 代码 ， 相 比 使 用 排序 ， 使 用 堆 不 仅 实 
现 效率 更 高 ， 而 且 可 以 应 对 数据 量 不 确定 且 源 源 不 断 到 来 的 情况 ， 可 
以 给 出 实时 结果 。 


之 前 章 和 我 们 还 介绍 过 ArrayDeque。PriorityQueue 和 ArrayDeque 都 
是 队列 ， 部 是 基 | 乡 组 的 但 都 不 是 简单 的 数组 ， 通 过 一 些 特殊 的 约 
束 、 辅 助 成 员 和 算法 ， 它 们 都 能 高 效 地 解决 一 些 特定 的 问题 ， 这 大 概 
是 计算 机 程序 中 使 用 数据 结构 和 算法 的 一 种 艺术 吧 。 


至 此 ， 关 于 堆 的 概念 与 算法 、 优 先 级 队列 PriorityQueue 及 其 应 用 ， 
就 介绍 完了 。 之 前 的 章节 中 ， 我 们 介绍 的 基本 都 是 具体 的 容器 类 ， 下 


一 章 ， 我 们 看 一 坚 抽象 窜 品 关 ， 以 及 针对 容器 接口 的 通用 功能 ， 并 对 
整个 容 右 类 体系 进行 忌 结 。 


x HH 


第 12 章 ”通用 容 需 类 和 总 结 


之 前 的 章 市 中 ， 我 们 介绍 的 都 十 具体 的 容 嚣 类， 本章 介 绍 一 些 抽 
象 容 名 类 、 一 此 活用 的 算法 和 功能 并 对 整个 容器 类 体系 进行 梳理 总 


之 前 介绍 的 具体 容 絮 类 其 实 都 不 是 从 头 构 建 的 ， 它 们 都 继承 了 一 
些 抽象 容器 类 。 这 些 抽 象 类 提供 了 容 右 接口 的 部 分 实现 ， 方 便 了 Java 
具体 容器 类 的 实现 。 此 外 ， 通 过 继承 抽象 类 ， 目 定义 的 类 也 可 以 更 为 
50 0 00 容 右 接口 。 为 什么 需要 实现 容 紫 接口 呢 ? 至 少 有 两 个 原 
o 


1) 容器 类 是 一 个 大 家 庭 ， 它们 之 间 可 以 方便 地 协作 ， 比 如 很 多 方 
法 的 参数 和 返回 值 都 是 容器 接口 对 象 ， 实 现 了 容器 接口 ， 就 可 以 方便 
地 参与 这 种 协作 。 


2) Java 有 一 个 类 Collections， 提 供 了 很 多 针对 容器 接口 的 通用 算 
法 和 功能 ， 实现 了 容 句 接口 ， 可 以 直接 利用 Collections 中 的 算法 和 功 
能 。 


本 章 首 先 介 绍 抽象 容 吉 类 ， 深 后 介 T 绍 Collections 中 的 通用 功能 
最 后 对 整个 容器 类 体系 进行 梳理 这 结 


12.1 抽象 容 胡 类 


抽象 容器 类 与 之 前 介绍 的 接口 和 具体 容器 类 的 关系 如 图 12-1 所 示 。 
虚线 框 表示 接口 ， 有 Collection、List、Set、Queue、Deque 和 
Map。 有 6 个 抽象 容器 类 。 


1) AbstractCollection: 实现 了 Collection 接 口 ， 被 抽象 类 
AbstractList、AbstractSet、AbstractQueue 继 承 ，ArrayDeque 也 继承 目 
AbstractCollection 〈 图 中 未 画 出 ) 。 


2) AbstractList: 父 类 是 AbstractCollection， 实 现 了 List 接 口 ， 被 
ArrayList、Abstract-SequentialList 继 承 。 


LinkedHashMap 
图 12-1 容器 类 体系 与 抽象 容器 类 


3) AbstractSequentialList: 父 类 是 AbstractList， 被 LinkedList 继 
厌 。 


4) AbstractMap: 实现 了 Map 接 口 ， 被 TreeMap、HashMap、 
EnumMap 继 承 。 


5) AbstractSet: 父 类 是 AbstractCollection， 实 现 了 Set 接 口 ， 被 
HashSet、TreeSet 和 EnumSet 继 厌 。 


6) AbstractQueue: 父 类 是 AbstractCollection， 实 现 了 Queue 接 口 ， 
被 PriorityQueue 继 承 。 


下 面 ， 我 们 分 别 来 介绍 这 些 抽象 类 ， 包 括 它 们 提供 的 基础 功能 、 
如 何 实 现 、 如 何 进 行 扩展 等 ， 代 码 分 析 基 于 Java 7。 


12.1.1 AbstractCollection 


AbstractCollection 提 供 了 Collection 接 口 的 基础 实现 ， 具 体 来 说 ， 它 
实现 了 如 下 方法 : 


public boolean addAll(Collection<? extends E> c) 
public boolean contains(Object 0) 

public boolean containsAll(Collection<?> c) 
public boolean isEmpty() 

public boolean remove(Object 0o) 

public boolean removeAll(Collection<?> c) 
public boolean retainAll(Collection<?> c) 
public void clear() 

public Object[] toArray() 

public <T> T[] toArray(T[] a) 

public String toString() 


AbstractCollection 又 不 知道 数据 是 怎么 存储 的 ， 它 是 如 何 实现 这 些 
方法 的 呢 ? 它 依赖 于 如 下 更 为 基础 的 方法 : 


public boolean add(E e) 
public abstract int size(); 
public abstract Iterator<E> iterator(); 


add 方 法 的 默认 实现 是 : 


public boolean add(E e) { 
throw new UnsupportedOoperationException(); 
} 


抛 出 “操作 不 支持 ”异常 ， 如 果子 类 集合 是 不 可 被 修改 的 ， 这 个 默 
认 实 现 就 可 以 了 ， 否 则 ， 必 须 重 写 add 方 法 。addAl 方 法 的 实现 就 是 循 
环 调用 add 方 法 。 


size 方 法 是 抽象 方法 ， 子 类 必须 重 写 。isEmpty 方 法 就 是 检查 size 方 
法 的 返回 值 是 否 为 0。toArray 方 法 依赖 size 方 法 的 返回 值 分 配 数组 大 


小 。 


iterator 方 法 也 是 抽象 方法 ， 它 返回 一 个 实现 了 迭代 需 接 口 的 对 
象 ， 子 类 必须 重 写 。 我 们 知道 ， 述 代 右 定义 了 三 个 方法 : 


boolean hasNext(); 
E next(); 
void remove(); 


如 有 条子 类 集合 旦 不 可 被 修改 的 ， 迭 代 融 不 用 实现 remove 方 法 ， 否 
则 ， 三 个 方法 都 必须 实现 。 


AbstractCollection 中 的 大 部 分 方法 都 是 基于 迭代 器 的 方法 实现 的 ， 
比如 contains 方 法 ， 其 代码 为 : 


public boolean contains(Object 0) { 
Iterator<E> it = iterator(); 
If(o==nul1) { 
while(it.hasNext()) 
if(it.next()==null) 
return true; 
} else 
while(it.hasNext()) 
if(o.equals(it.next())) 
return true; 


} 
return false; 


通过 适 代 器 方法 循环 进行 比较 。 


除了 接口 中 的 方法 ，Collection 接 口 文档 建议 ， 每 个 Collection 接 口 
的 实现 类 都 应 该 提供 至 少 两 个 标准 的 构造 方法 ， 一 个 是 默认 构造 方 


法 ， 男 一 个 接受 一 个 Collection 类 型 的 参数 。 


其 你 如 何 通过 继承 AbstractCollection 来 实现 目 定义 容 絮 呢 ? 我 们 通 
过 一 个 简单 的 例子 来 说 明 。 我 们 使 用 在 8.1 广 目 己 实现 的 动态 数组 容 絮 
se 简单 的 Collection 。 


DynamicArray 当 时 没有 实现 根据 索引 添加 和 删除 的 方法 ， 我 们 先 
来 补充 一 下 ， 如 代码 请 单 12-1 所 示 。 


代码 清单 12-1 添加 方法 后 的 DynamicArray 


public class DynamicArray<E> { 
//... 


public E remove(int index) { 
E oldValue = get(index); 
int numMoved = size - index - 1; 
if(numMoved > 0) 
System.arraycopy(elementData, index + 1, elementData, index, 
numMoved ) ， 
elementData[--size] = null; 
return oldValue,; 


public void add(int index, E element) { 
ensureCapacity(size + 1); 
System.arraycopy(elementData, index, elementData, index + 1, 
size - index); 
elementData[index] = element ， 
SIZe++' 


基于 DynamicArray， 我 们 实现 一 个 简单 的 迭代 希 类 
DynamicArrayIterator， 如 代码 清单 12-2 所 示 。 


代码 清单 12-2 一 个 简单 的 迭代 器 类 DynamicArrayIterator 


public class DynamicArrayIterator<E> implements Iterator<E>{ 
DynamicArray<E> darr,; 
int cursor; 
int lastRet = -1; 
public DynamicArrayIterator(DynamicArray<E> darr)t{ 
this.darr = darr; 


Q@Override 
public boolean hasNext() { 

return cursor != darr.size(); 
Q@Override 


public E next() { 
int i = cursor; 
if(i >= darr.size()) 
throw new NoSuchElementException(); 


cursor =i+1; 
lastRet = i,; 
return darr.get(i); 


Q@Override 
public void remove() { 
if(lastRet < 0) 
throw new IllegalSstateException(); 
darr.remove(lastRet); 
cursor = lastRet,; 
lastRet = -1; 


代码 很 商 单 ， 束 不 解释 了 ， 为 简单 起 见 ， 我 们 没有 实现 实际 容 郁 
类 中 的 有 关 检 测 结构 性 变化 的 逻辑 。 


基于 DynamicArray 和 DynamicArrayIterator， 通 过 继承 
AbstractCollection， 我 们 来 实现 一 个 人 简单 的 容器 类 MyCollection， 如 代 
码 清单 12-3 所 示 。 


代码 清单 12-3 一 个 简单 的 容器 类 MyCollection 


public class MyCollection<E> extends AbstractCollection<E> { 
DynamicArray<E> darr,; 
public MyCollection(){ 
darr = new DynamicArray<>(); 


} 

public MyCollection(Collection<? extends E> c){ 
this( ); 
addAll(c); 


Q@Override 
public Iterator<E> iterator() { 
return new DynamicArrayIterator<>(darr); 


Q@Override 
public int size() { 
return darr.size(); 


Q@Override 

public boolean add(E e) { 
darr.add(e); 
return true; 


代码 很 镜 单 ， 束 是 按 建议 提供 了 两 个 构造 方法 ， 并 重 写 了 size 、 
add 和 iterator 方 法 ， 这 些 方法 内 部 使 用 了 DynamicArray 和 
DynamicArrayJIterator ° 


12.1.2 AbstractList 


AbstractList 提 供 了 List 接 口 的 基础 实现 ， 具 体 来 说 ， 它 实现 了 如 下 
方法 : 


public boolean add(E e) 

public boolean addAll(int index, Collection<? extends E> c) 
public void clear() 

public boolean equals(Object o) 

public int hashcode() 

public int indexof(Object 0o) 

public Iterator<E> iterator() 

public int lastIindexof(Object 0o) 

public ListIterator<E> listIterator() 

public ListIterator<E> listIiterator(final int index) 
public List<E> subList(int fromIndex, int toIndex) 


AbstractList 是 怎么 实现 这 些 方 法 的 呢 ? 它 依赖 于 如 下 更 为 基础 的 
pa 


public abstract int size(); 

abstract public E get(int index); 
public E set(int index, E element) 
public void add(int index, E element) 
public E remove(int index) 


size 方 法 与 AbstractCollection 一 样 ， 也 是 抽象 方法 ， 子 类 必须 重 
与 。get 方 法 根据 索引 index 获 取 元 素 ， 它 也 是 抽象 方法 ， 子 类 必须 重 
写 O 


set、add、remove 方 法 都 是 修改 容器 内 容 ， 它 们 不 是 抽象 方法 ， 但 
默认 实现 都 是 抛 出 异常 UnsupportedOperationException。 如 果子 类 容器 
不 可 被 修改 ， 这 个 默认 实现 瓯 可 以 了 。 如 有 果 可 以 根据 索引 修改 内 容 ， 
应 该 重 写 set 方 法 。 如 果 容 器 是 长 度 可 变 的 ， 应 该 重 写 add 和 remove 方 


法 。 


与 AbstractCollection 不 同 ， 继 承 AbstractList 不 需要 实现 迭代 器 类 和 
相关 方法 ，AbstractList 内 部 实现 了 两 个 迭代 器 类 ， 一 个 实现 了 Tterator 接 
口 ， 另 一 个 实现 了 Listiterator 接 口 ， 它 们 是 基于 以 上 的 这 些 基 础 方法 实 
现 的 ， 逻 辑 比 较 人 简单 ， 就 不 著述 了 了。 


具体 如 何 扩展 AbstractList 呢 ? 我 们 来 看 个 例子 ， 也 通过 
DynamicArray 来 实现 一 个 简单 的 List， 如 代码 清单 12-4 所 示 。 


代码 清单 12-4 扩展 AbstractList 的 List 实 现 


public class MyList<E> extends AbstractList<E> { 
private DynamicArray<E> darr; 
public MyList(){ 
darr = new DynamicArray<>(); 


public MyList(Collection<? extends E> c){ 
this( ); 
addAll(c); 


@Override 
public E get(int index) { 
return darr.get(index); 


Q@Override 
public int size() { 
return darr.size(); 


@Override 
public E set(int index, E element) { 
return darr.set(index, element); 


Q@Override 

public void add(int index, E element) { 
darr.add(index, element); 

@Override 


public E remove(int index) { 
return darr.remove(index); 
} 


代码 很 简单 ， 就 是 按 建议 提供 了 两 个 构造 方法 ， 并 重 写 了 size 、 
get、set、add 和 和 remove 方 法 ， 这 些 方法 内 部 使 用 了 DynamicArray 。 
12.1.3 AbstractSequentialList 


AbstractSequentialList 是 AbstractList 的 于 类 ， 也 提供 了 List 接 口 的 基 
础 实现 ， 具 体 来 说 ， 它 实现 了 如 下 方法 : 


public void add(int index, E element) 

public boolean addAll(int index, Collection<? extends E> c) 
public E get(int index) 

public Iterator<E> iterator() 


public E remove(int index) 
public E set(int index, E element) 


可 以 看 出 ， 它 实现 了 根据 索引 位 置 进行 操作 的 get、set、add、 
remove 方 法 ， 它 是 怎么 实现 的 呢 ? 它 是 基于 ListIterator 接 口 的 方法 实现 
的 ， 在 AbstractSequentialList 中 ，1listIterator 方 法 被 重 写 为 了 一 个 抽象 方 


法 : 


public abstract ListIterator<E> listIterator(int index) 


子 类 必须 重 写 该 方法 ， 并 实现 送 代 器 接口 。 


我 们 来 看 段 具体 的 代码 ， 看 get、set、add、remove 是 如 何 基于 
ListIterator 实 现 的 。get 方 法 代码 为 : 


public E get(int index) { 
try { 
return listIiterator(index).next(); 
} catch (NoSuchElementException exc) 
throw new IndexOutofBoundsException("Index: "+index); 


} 
} 


代码 很 简单 ， 其 他 方法 也 都 类 似 ， 束 不 芍 述 了 。 


注意 与 AbstractList 相 区 别 ， 可 以 说 ， 虽 然 AbstractSequentialList 是 
AbstractList 的 子 类 ， 但 实现 逻辑 和 用 法 上 ， 与 AbstractList 正 好 相反 。 


.AbstractList 需 要 具体 子 类 重 写 根据 索引 操作 的 方法 get、set、 
add、remove， 它 提供 了 送 代 器 ， 但 送 代 旭 是 基于 这 些 方法 实现 的 。 它 
假定 子 类 可 以 高 效 地 根据 索引 位 置 进 行 操作 ， 适 用 于 内 部 是 随机 访问 
类 型 的 存储 结构 《如 数组 ) ， 比 如 ArrayList 就 继承 自 AbstractList 。 


.AbstractSequentialList 需 要 具体 子 类 重 写 迭 代 器 ， 它 提供 了 根据 索 
引 操 作 的 方法 get、set、add、remove， 但 这 些 方 法 是 基于 迭代 器 实现 
的 。 它 适用 于 内 部 是 顺序 访问 类 型 的 存储 结构 (如 链表 ) ， 比 如 
LinkedList 就 继承 目 AbstractSequentialList 。 


具体 如 何 扩 展 AbstractSequentialList 呢 ? 我 们 还 是 以 DynamicArray 
举例 来 说 明 ， 在 实际 应 用 中 ， 如 条 内 部 存储 结构 类 似 DynamicArray， 
应 该 继承 AbstractList， 这 里 主要 是 演示 其 用 法 。 


扩展 AbstractSequentialList 需 要 实现 ListIterator， 前 面 介绍 的 
DynamicArrayIterator 只 实现 了 Iterator 接 口 ， 通 过 继承 
DynamicArrayIterator， 我 们 实现 一 个 新 的 实现 了 List-Iterator 接 口 的 类 
DynamicArrayListIterator， 如 代码 清单 12-5 所 示 。 


代码 清单 12-5 ”实现 了 ListIterator 接 口 的 类 DynamicArrayListIterator 


public class DynamicArrayListIterator<E> 
extends DynamicArrayIterator<E> implements ListIterator<E>{ 
public DynamicArrayListIterator(int index, DynamicArray<E> darr){ 
super(darr); 
this.cursor = index; 


Q@Override 

public boolean haspPrevious() { 
return cursor > 0; 

} 


Q@Override 
public E previous() { 
if(!hasprevious()) 
throw new NoSuchElementException(); 
Cursor--， 
lastRet = cursor; 
return darr.get(lastRet); 


Q@Override 
public int nextIndex() { 
return cursor; 


Q@Override 
public int previousIndex() { 
return cursor - 1; 


Q@Override 
public void set(E e) { 
if(lastRet==-1)f{ 
throw new IllegalStateException(); 


} 
darr.set(lastRet, e); 


Q@Override 

public void add(E e) { 
darr.add(cursor, e); 
CUrSoOrt+; 
lastRet = -1; 


逻辑 比较 简单， 就 不 解释 了 。 有 了 DynamicArrayListIterator， 我 们 
看 基于 Abstract-SequentialList 的 List 实 现 ， 如 代码 清单 22-6 所 示 。 


代码 清单 12-6 ”基于 AbstractSequentialList 的 List 实 现 


public class MySeqList<E> extends AbstractSequentialList<E> { 
private DynamicArray<E> darr; 
public MySeqList(){ 
darr = new DynamicArray<>(); 


public MySeqList(Collection<? extends E> c){ 
this( ); 
addAll(c); 


@Override 
public ListIterator<E> listIterator(int index) { 
return new DynamicArrayListIterator<>(index，darr)， 


Q@Override 

public int size() { 
return darr.size(); 

} 


代码 很 简单 ， 就 是 按 建议 提供 了 两 个 构造 方法 ， 并 重 写 了 size 和 
listIterator 方 法 ， 送 代 絮 的 实现 是 DynamicArrayListIterator 。 


12.1.4 AbstractMap 


AbstractMap 提 供 了 了 Map 接口 的 基础 实现 ， 具 体 来 说 ， 它 实现 了 如 
下 


public void clear() 

public boolean containskey(Object key) 
public boolean containsValue(Object value) 
public boolean equals(Object o) 

public V get(Object key) 

public int hashcode() 

public boolean isEmpty() 

public Set<k> keySet() 

public void putAll(Map<? extends K, ? extends V> m) 
public V remove(Object key) 

public int size() 

public String toString() 

public Collection<V> values() 


_AbstractMap 尽 如 何 实现 这 些 亡 法 的 呢 ? 它 依赖 于 如 下 更 为 基础 的 
法 : 


public V put(K key, V value) 
public abstract Set<Entry<K,V>> entrySet(); 


putAl 残 是 循环 调用 put。put 方 法 的 默认 实现 是 抛 出 异常 
UnsupportedOperation-Exception， 如 果 Map 是 允许 写 入 的 ， 则 需要 重 写 
该 方 屠 闻 


其 他 方法 都 基于 entrySet 方 法 。entrySet 方 法 是 一 个 抽象 方法 ， 子 类 
必须 重 写 ， 它 返回 所 有 键 值 对 的 Set 视 图 ， 如 果 Map 是 允许 删除 的 ， 这 
个 Set 的 迭代 器 实现 类 ， 即 entrySet () .iterator () 的 返回 对 象 ， 必 须 实 
现 欠 代 硕 的 remove 方 法 ， 这 是 因为 AbstractMap 的 remove 方 法 是 通过 
entrySet () .iterator () :remove () 实现 的 。 


除了 提供 基础 方法 的 实现 ，AbstractMap 类 内 部 还 定义 了 两 个 公有 
的 静态 内 部 类 ， 表 示 键 值 对 : 


AbstractMap.SimpleEntry implements Entry<K,V> 
AbstractMap.SimpleImmutableEntry implements Entry<K,V> 


SimpleImmutableEntry 用 于 表示 只 读 的 键 值 对 ， 而 SimpleEntry 用 于 
表示 可 写 的 。 


”” Map 接口 文档 建议 : 每 个 Map 接 口 的 实现 类 都 应 该 提供 至 少 两 个 标 
准 罗 构造 方法 ， 个 是 默认 构造 方法 ， 男 一 个 接受 一 个 Map 类 型 的 参 


具体 如 何 扩 展 AbstractMap 呢 ? 我 们 定义 一 个 简单 的 Map 实 现 类 
MyMap， 内 部 还 是 用 DynamicArray， 如 代码 清单 12-7 所 示 。 


代码 清单 12-7 一 个 简单 的 Map 实 现 类 MyMap 


public class MyMap<K, V> extends AbstractMap<K，V> { 
private DynamicArray<Map.Entry<K, V>> darr,; 
private Set<Map.Entry<K, V>> entrySet = null; 
public MyMap() { 
darr = new DynamicArray<>(); 


} 

public MyMap(Map<? extends Kk, ? extends V> m) { 
this( ); 
putAll(m); 


Q@Override 
public Set<Entry<K, V>> entrySet() { 
Set<Map .Entry<K，V>> es = entrySet,; 
return es != null ? es : (entrySet = new EntrySet())， 


Q@Override 
public V put(K key, V value) { 
for(int i = 0; i < darr.size(); i++) { 
Map .Entry<K，V> entry = darr.get(i); 
if((key == null && entry.getkey() == null) 
|| (key != null && key.equals(entry.getkey()))) { 
V oldValue = entry.getValue(); 
entry.setValue(value); 
return oldValue; 


} 


Map .Entry<K，V> newEntry = new AbstractMap.SimpleEntry<>(key, value); 
darr.add(newEntry); 
return null; 


class EntrySet extends AbstractSet<Map ,Entry<K，V>> { 
public Iterator<Map .Entry<K，V>> iterator() { 
return new DynamicArrayIterator<Map .Entry<K，V>>(darr)， 


public int size() { 
return darr.size(); 
} 


我 们 定义 了 两 个 构造 方法 ， 实 现 了 put 和 entrySet 方 法 。 "put 让 
通过 循环 查找 是 否 已 存在 对 应 的 键 ， 如 果 存 在 则 修改 值 ， 否 则 新 建 一 
个 键 值 对 (类 型 为 AbstractMap.Simple-Entry) 并 添加 。 antrySet 返 回 的 
类 型 是 一 个 内 部 类 EntrySet， 它 继承 目 AbstractSet， 重 写 了 size 和 iterator 
力 io 有 中 ， 返 回 的 是 迭代 器 类 型 是 DynamicArrayIterator， 它 
支持 remove 方 法 。 


12.1.5 AbstractSet 


AbstractSet 提 供 了 Set 接 口 的 基础 实现 ， 它 继承 目 
AbstractCollection， 增 加 了 equals 和 hashCode 方 法 的 默认 实现 。Set 接 口 
要 求 容 器 内 不 能 包含 重复 元 素 ，AbstractSet 并 没有 实现 该 约束 ， 子 类 需 
要 目 己 实现 。 


扩展 AbstractSet 与 AbstractCollection 是 类 似 的 ， 只 是 需要 实现 无 重 
复元 素 的 约束 ， 比如 ， add 方 法 内 需要 检查 元 素 是 否 已 经 添加 过 了 5 具 
体 实现 比较 简单 ， 我 们 就 不 获 述 了 。 


12.1.6 AbstractQueue 


AbstractQueue 提 供 了 Queue 接 口 的 基础 实现 ， 它 继承 目 
AbstractCollection ， 实 现 了 如 下 方法 : 


public boolean add(E e) 

public boolean addAll(Collection<? extends E> c) 
public void clear() 

public E element() 

public E remove() 


这 些 方法 古 基于 Queue 接 口 的 其 他 方法 实现 的 ， 包 括 : 


E peek(); 
E poll(); 
boolean offer(E e); 


扩展 AbstractQueue 需 要 实现 这 些 方 法 ， 具 体 逻 辑 也 比较 人 简单， 我 
们 束 不 改 述 了 。 


12 主 7 处 结 


本 小 节 介 绍 了 Java 容 器 类 中 的 抽象 类 AbstractCollection、 
AbstractList、AbstractSequen-tialList、AbstractSet、AbstractQueue 以 及 
AbstractMap， 介 绍 了 它们 与 容器 接口 和 具体 类 的 关系 ， 对 每 个 抽象 
类 ， 介 绍 了 它 提供 的 基础 功能 ， 如 何 实现 ， 并 举例 说 明了 如 何 进 行 扩 
展 ， 人 完整 的 代码 在 github 上 ， 地 址 为 https://github.com/swiftma/program- 
logic ， 位 于 包 shuo.lao-ma.collection.c52 下 。 


前 面 我 们 提 到 ， 实 现 了 容器 接口 ， 就 可 以 方便 地 参与 到 容器 类 这 
个 大 家 庭 中 进行 相互 协作 ， 也 可 以 方便 地 利用 Collections 这 个 类 实现 的 
通用 算法 和 功能 。 


但 Collections 都 实现 了 哪些 算法 和 功能 ? 都 有 什么 用 途 ? 如 何 使 
用 ? 内 部 又 是 如 何 实现 的 ? 有 何 参 考 价值 ? 让 我 们 下 一 小 节 来 探讨 。 


12.2 Collections 


类 Collections 以 静态 方法 的 方式 提供 了 很 多 通用 算法 和 功能 ， 这 
些 功 能 大 概 可 以 分 为 两 类 。 


1) 对 容器 接口 对 象 进行 操作 。 

2) 返回 一 个 容器 接口 对 象 。 

对 于 第 1 类 ， 操 作 大 概 可 以 分 为 三 

.查找 和 替换 。 

-排序 和 调整 顺序 。 

:添加 和 修改 。 

对 于 第 2 类 ， 大 概 可 以 分 为 两 组 。 

.适配器 : 将 其 他 类 型 的 数据 转换 为 容器 接口 对 象 。 

:装饰 器 : 修饰 一 个 给 定 容器 接口 对 象 ， 增 加 某 种 性 质 。 

它们 都 是 围绕 容器 接口 对 象 的 ， 第 1 类 是 针对 容器 接口 的 通用 操 
咎 ， 这 是 面向 接口 编程 的 一 种 体现 ， 是 接口 的 典型 用 法 ; 第 2 类 是 为 了 


f 
使 更 多 类 型 科 数 据 更 为 方便 和 安全 地 参与 介 窑 器 天 协作 体系 中 。 下 面 
我 们 分 别 介绍 这 两 类 操作 及 其 实现 原理 ， 代 码 分 析 基 于 Java 7。 


12.2.1 查找 和 替换 


查找 和 替换 包含 多 组 方法 。 碍 找 包 括 二 分 查找 、 碍 找 最 大 值 /最 小 
值 、 查 找 元 素 出 现 次 数 、 查 找 子 List、 查 看 两 个 集合 是 否 有 交集 等 ， 
下 面具 体 介绍 。 


1 二 涩 章 懂 


我 们 在 介绍 Arrays 类 的 时 候 介 绍 过 二 分 查找 ，Arrays 类 有 和 针对 数组 
0 ps y 碍 查找 方法 ， | > 分 查找 ， 如 


public static <T> int binarySearch( 
List<? extends Comparable<? super T>> list, T key) 
public static <T> int binarySearch(List<? extends T> list, 
T key, Comparator<? super T> c) 


从 方法 参数 角度 而 言 ， 一 个 要 求 List 的 每 个 个 元 条 实现 Comparable 梯 
口 ， 男 一 个 不 需要 ， 但 要 求 提供 Comparator。 二 分 查找 假定 List 中 的 元 
系 是 从 小 到 大 排序 的 。 如 果 是 从 大 到 小 排序 的 ， 需 要 传递 一 个 逆序 
Comparator 对 象 ，Collections 提 供 了 返回 逆序 Comparator 的 方法 ， 之 前 
我 们 也 用 过 


public static <T> Comparator<T> reverseOrder() 
public static <T> Comparator<T> reverseorder(Comparator<T> cmp) 


比如 ， 可 以 这 么 用 : 


List<Integer> list = new ArrayList<>(Arrays.asList(new Integer[]{ 
35, 24, 13, 12, 8, 7, 1 
})); 


System.out.println(Collections.binarySearch(list, 7, 
Collections.reverseOrder())); 


输出 为 : 5。List 的 二 分 得 找 的 基本 思路 与 Arrays 中 的 是 一 样 的 ， 

数组 可 以 根据 索引 直接 定位 任意 元 素 ， 实 现 效率 很 高 ， 但 List 瓯 不 一 
定 了 ， 具 体 分 为 两 种 情况 ， 如 果 List 可 以 随机 访问 (如 数组 ， 即 实 
现 了 RandomAccess 接 口 ， 或 者 元 素 个 数 比较 少 ， 则 实现 思路 与 Arrays 
一 样 ， 根 据 索 引 直 接 访 问 中 间 元 素 进行 比较 ， 人 否则 使 用 迭代 磺 的 方式 
移动 到 中 间 元 素 进 行 比较 。 从 效率 角度 ， 如 果 List 支 持 随机 访问 ， 效 
率 为 0 (log。 (N) ) ， 如 果 通 过 迭代 器 ， 那 么 比较 的 次 数 为 O (log, 
(N) ) ， 但 ; 遍历 移动 的 次 数 为 (N) ，N 为 列表 长 度 。 


2. 查 找 最 大 值 /最 小 值 


Collections 提 供 了 如 下 查找 最 大 值 /最 小 值 的 方法 〈 省 略 了 修饰 符 


public static ) 


<T extends Object & Comparable<? Super T>> T max(Collection<? extends T> coll) 
<T> T max(Collection<? extends T> coll, Comparator<? Super T> comp) 
<T extends Object & Comparable<? super T>> T min(Collection<? extends T> coll) 
<T> T min(Collection<? extends T> coll, Comparator<? super T> comp) 


含义 和 用 法 都 很 直接 ， 实 现 思路 也 很 简单 ， 就 是 通过 迭代 器 进行 
比较 ， 比 如 : 


public static <T extends Object & Comparable<? super T>> T max( 
Collection<? extends T> coll) { 
Iterator<? extends T> i = coll.iterator(); 
T candidate = i.next(); 
while(i.hasNext()) { 
T next = i,.next(); 
if(next.compareTo(candidate) > 0) 
candidate = next,; 


return candidate,; 


3. 其 他 方法 
查找 元 素 出 现 次 数 ， 方 法 为 : 


public static int frequency(Collection<?> c, Object 0) 


ned o 可 以 为 nul。 含 义 很 徐 单 ， 实 
现 思路 也 很 徐 单 ， 就 是 通过 和 迭代 必 进 行 比 较 计 数 。 


Collections 提 供 了 如 下 方法 ， 在 source List 中 查找 target List 的 位 
置 : 


public static int indexOofSubList(List<?> source, List<?> target) 
public static int lastIindexofSubList(List<?> source, List<?> target) 


indexOfSubList 从 开头 找 ，lastIndexOfSubList 从 结尾 找 ， 没 找到 返 
回 -1， 找 到 返回 第 一 个 匹配 元 素 的 索引 位 置 。 这 两 个 方法 的 实现 都 是 


属于 “又 力 破解 "型 的 ， 将 target 列 表 与 source 从 第 一 个 元 素 开 始 的 列表 
逐个 元 素 进 行 比较 ， 如 果 不 匹 配 ， 则 与 Source 从 第 二 个 元 素 开 始 的 列 
再 不 匹配 ， 与 source 从 第 三 个 元 素 开 始 的 列表 比较 ， 以 此 类 


public static boolean disjoint(Collection<?> ci1, Collection<?> c2) 


如 果 c1 和 c2 有 交集 ， 返 回 值 为 false; 没有 交集 ， 返 回 值 为 tue。 实 
现 原理 也 很 徐 单 ， 通 历 其 中 一 个 容器 ， 对 每 个 元 素 ， 在 另 一 个 容 髓 里 
通过 contains 方 法 检查 是 否 包 含 该 元 素 ， 如 果 包 含 ， 返 回 false， 如 果 最 
后 不 包含 任何 元 丸 返 回 true。 这 个 方法 的 代码 会 根据 容器 是 否 为 Set 以 
及 集合 大 小 进行 性 能 优化 ， 即 选择 哪个 容 絮 进行 遍历 ， 哪 个 容 絮 进行 
检查 ， 以 减少 总 的 比较 次 数 ， 有 具体 我 们 束 不 介绍 了 。 


答 换 方法 为 : 


public static <T> boolean replaceAll(List<T> list, T oldVal, T newVal) 


将 List 中 的 所 有 oldVal 替 换 为 newVal， 如 果 发 生 了 替换 ， 返 回 值 为 
true， 人 否则 为 false。 用 法 和 实现 都 比较 简单 ， 束 不 性 述 了 。 


12.2.2 ”排序 和 调整 顺序 


针对 List 接 口 对 象 ，Collections 除 了 提供 基础 的 排序 ， 还 提供 了 大 
干 调整 顺序 的 方法 ， 包 括 交 换 元 素 位 置 、 翻 转 列表 顺序 、 随 机 化 重 
排 、 循 环 移 位 等 ， 下 面具 体 介绍 。 


1. 排 序 、 交 换 位 置 与 翻转 


Arrays 类 有 针对 数组 对 象 的 排序 方法 ，Collections 提 供 了 针对 List 
接口 的 排序 方法 ， 如 下 所 示 : 


public static <T extends Comparable<? super T>> void sort(List<T> list) 
public static <T> void sort(List<T> list, Comparator<? Super T> c) 


使 用 很 简单 ， 融 不 举例 了 ， 内 部 它 是 通过 Arrays.sort 实 现 的 ， 先 将 
List 元 素 复 制 到 一 个 数组 中 ， 然 后 使 用 Arrays.sort， 排 序 后 ， 再 复制 回 
Tist 代 簿 如 下 所 示 ， 


public static <T extends Comparable<? Super T>> void sort(List<T> list) { 
Object[] a = list.toArray(); 
Arrays.sort(a); 
ListIiterator<T> i = list.listIiterator(); 
for(int j=0; j<a.length; j++) { 
i.next(); 
i.set((T)a[j]); 


交换 元 素 位 置 的 方法 为 : 
public static void swap(List<?> list, int i, int j) 
交换 list 中 第 i 个 和 第 j 个 元 素 的 内 容 。 实 现代 码 为 : 


public static void swap(List<?> list, int i, int j) { 
final List 1 = list,; 
1.set(i, 1.set(j, 1.get(i))); 


翻转 列表 顺序 的 方法 为 : 


public static void reverse(List<?> list) 


将 list 中 的 元 素 顺 序 翻转 过 来 。 实 现 思路 就 是 将 第 一 个 和 最 后 一 个 
交换， 第 二 个 和 倒数 第 二 个 交换 ， 以 此 类 推 ， 直 到 中 间 两 个 元 素 交 换 
完毕 。 如 果 1list 实 现 了 RandomAccess 接 口 或 列表 比较 小 ， 根 据 索 引 位 
村 使 用 上 面 的 swap 方 法 进行 交换 ， 否则 ， 由 于 直接 根据 索引 位 置 定 
比较 低 ， 使 用 一 前 一 后 两 个 listIterator 定 位 待 交 换 的 元 素 ， 


public static void reverse(List<?> list) { 
int size = lJist.sizel(); 


if(size < REVERSE_THRESHOLD || list instanceof RandomAccess) { 
for(int i=0, mid=size>>1, j=size-1; i<mid; i++, j--) 
swap(list, i, j); 
} else { 
ListIterator fwd = list.listIiterator(); 
ListIterator rev = list.]listIterator(size); 
for(int i=0, mid=]list.size()>>1; i<mid; i++) { 
Object tmp = fwd.next(); 
fwd.set(rev.previous( ) ) ， 
rev.set(tmp); 


2. 随 机 化 重 排 


我 们 在 随机 一 节 介 绍 过 洗 牌 算法 ，Collections 直 接 提供 了 对 List 元 
素 洗 牌 的 方法 : 


public static void shuffle(List<?> list) 
public static void shuffle(List<?> list, Random rnd) 


实现 思路 与 随机 一 节 介 绍 的 古 一 样 的 ， 从 后 往 前 负 历 列表 ， 
给 每 个 位 置 重新 赋值 ， 值 从 前 面 的 未 重新 赋值 的 元 素 中 随机 挑选 1 
果 列 表 实 现 了 RandomAccess 接 口 ， 或 者 列表 比较 小 ， 直 接 使 用 前 面 
swap 方 法 进行 交换 ， 否 则 ， 先 将 列表 内 容 复 制 到 一 个 数组 中 ， 洗 牌 ， 
再 复制 回 列表 。 代 码 为 : 


public static void shuffle(List<?> list, Random rnd) { 
int Size = lJist.sizel(); 
if(size < SHUFFLE_ THRESHOLD || list instanceof RandomAccess) { 
for(int i=size; i>1; i--) 
swap(list, i-1, rnd.nextInt(i)); 
} else { 
Object arr[] = list.toArray(); 
// 对 数组 进行 洗 牌 
for(int i=size; i>1; i--) 
swap(arr, i-1, rnd.nextInt(i)); 
// 将 数组 中 洗 牌 后 的 结果 保存 回 list 
ListIterator it = list.1listIiterator(); 
for(int i=0; i<arr.length; i++) { 
it.next(); 
it.set(arr[i]); 


} 
} 
} 


3. 循 环 移 位 
我 们 解释 下 循环 移 位 的 概念 ， 比 如 列表 为 : 


[8, 5, 3, 6, 2] 


循环 右 移 2 位 ， 会 变 为 : 


[6, 2, 8, 5, 3] 


如 条 是 循环 左 移 2 位 ， 会 变 为 : 


[3，6，2，8，5] 


因为 列表 长 度 为 5， 循 环 左 移 3 位 和 循环 右 移 2 位 的 效果 是 一 样 的 。 
循环 移 位 的 方法 是 : 


public static void rotate(List<?> list, int distance 


distance 表 示 循 环 移 位 个 数 ， 一 般 正 数 表 示 癌 右 移 ， 负 数 表示 癌 左 
移 ， 比 如 : 


List<Integer> list1 = Arrays.asList(new Integer[]{ 
8, 5, 3, 6, 2 

}); 

Collections.rotate(list1, 2); 

System,.out.println(1list1); 

List<Integer> list2 = Arrays.asList(new Integer[]{ 
8, 5, 3, 6, 2 


了 
Collections.rotate(list2, -2); 
System,.out.println(1list2); 


输出 为 : 


IE 
WO 


2, 8, 5, 3] 
6, 2, 8, 5] 


这 个 方法 很 有 用 的 一 点 十: 它 也 可 以 用 于 子 列表 ， 可 以 调整 子 列 
表 内 的 顺序 而 不 改变 其 他 元 素 的 位 置 。 比 如 ， 将 第 j 个 元 素 癌 前 移动 到 
k (k>j) ， 可 以 这 么 写 : 


Collections.rotate(list.subList(j, k+1), -1); 


再 举 个 例子 : 


List<Integer> list = 0 asList(new Integer[]t{ 
8, 5, 3, 6, 2, 19, 21 


}); 
Collections.rotate(list.subList(1, 5), 2); 
System.out.println(1list),; 


输出 为 : 
[8, 6, 2, 5, 3, 19, 21] 


这 个 类 似 于 列表 内 的 * 剪 切 ? 和 “粘贴 ”>， 将 子 列 表 [5，3]* 剪 

“粘贴 ?到 ?2 后面。 如 果 需 要 实现 类 似 * 前 切 ” 利 “粘贴 ”的 功能 ， 可 
以 使 用 rotate () 方法 。 

循环 移 位 的 内 部 实现 比较 巧妙 ， 根 据 列表 大 小 和 是 否 实现 了 
RandomAccess 接 口 ， 有 两 个 算法 ， 都 比较 巧妙 ， 两 个 算法 在 《编程 珠 
现 》 这 本 书 的 2.3 节 有 描述 。 

限于 篇 幅 ， 我 们 只 解释 下 其 中 的 第 二 个 算法 ， 它 将 循环 移 位 看 作 
es 序 交 换 。 再 来 看 上 面 的 例子 ， 循 环 左 移 2 
也: 


[8, 5) 3, 6, 2] Se [3， 6, 2, 8, 5] 


就 是 将 [8，5] 和 [3，6，2] 两 个 子 列表 的 顺序 进行 交换 。 循 环 右 移 


两 位 : 
[8, 5, 3, 6, 2] 52 [6， 2, 8, 5, 3] 


就 是 将 [8，5，3] 和 [6，2] 两 个 子 列表 的 顺序 进行 交换 。 

根据 列表 长 度 size 和 移 位 个 数 distance， 可 以 计算 出 两 个 子 列表 的 
分 隔 点 ， 有 了 两 个 子 列表 后 ， 两 个 子 列表 的 顺序 交换 可 以 通过 三 次 翻 
转 实 现 。 比 如 ， 有 A 和 B 两 个 子 列表 ， ee B 有 n 个 元 素 : aj 
d2 .dm bj b, :2b 要 变 为 bj b，.. .b， dl d2. 可 经 过 三 次 翻转 实 
现 : 


(1) 翻转 子 列表 A 

0 yb 
(2) 翻转 子 列表 B 

a a 全 
(3) 翻转 整个 列表 

Be ya Db Di = Do Di 


这 个 算法 的 整体 实现 代码 为 : 


private static void rotate2(List<?> list, int distance) { 
int size = list.size(); 


if(size == 0) 
return,; 
int mid = -distance % size; 
if(mid < 0) 
mid += size; 
if(mid == 0) 
return， 


reverse(list.subList(0, mid)); 
reverse(list.subList(mid, size)); 
reverse(list); 


mid 为 两 个 子 列表 的 分 割 点 ， 调 用 了 三 次 reverse 方 法 以 实现 子 列表 
顺序 交换 。 


12.2.3 ”添加 和 修改 


Collections 也 提供 了 几 个 批量 添加 和 修改 的 方法 ， 逻 辑 都 比较 们 
单 ， 我 们 看 下 。 


批量 添加 ， 方 法 为 : 


public static <T> boolean addAll(Collection<? super T> c, T... elements) 


本 
; 比如: 


List<String> list = new ArrayList<String>(); 

String[] arr = new String[]{" 深 入 "," 浅 出 "}， 
Collections.addAll(list，"hello"，"world",，" 老 马 ",， "编程 ")，; 
Collections.addAll(list, arr); 


System.out.println(1list),; 


输出 为: 


[hello，world， 老 马 ， 编 程 ， 深 入 ， 浅 出 ] 


批量 填充 固定 值 ， 方 法 为 : 


public static <T> void fill(List<? super T> list, T obj) 


WR 


批量 复制 ， 方 法 为 : 


public static <T> void copy(List<? Super T> dest, List<? extends T> src) 


将 列表 src 中 的 每 个 元 素 复 制 到 列表 dest 的 对 应 位 置 处 ， 禾 盖 dest 中 
dest 中 超过 src 长 度 部 分 的 元 
系 不 受 影响 。 


12.24 适 配 欠 


所 谓 适 配器 ， 就 是 将 一 种 类 型 的 接口 转换 成 男 一 种 接口 ， 类 似 于 
电子 设备 中 的 各 种 USB 转 接头 ， 一 端 连 接 某 种 特殊 类 型 的 接口 ， 一 段 
连接 标准 的 USB 接 口 。Collections 类 提供 了 几 组 类 似 于 适 配 右 的 方法 : 


. 空 容 句 方法 : 类似 于 将 null 或 “ 空 ”转换 为 一 个 标准 的 容器 接口 对 
大 单一 对 象 方法 : 将 一 个 单独 的 对 象 转换 为 一 个 标准 的 容器 接口 对 
.其 他 适 配 方法 : 将 Map 转 换 为 Set 等 。 
它们 接受 其 他 类 型 的 数据 ， 转 换 为 一 个 容 需 接口， 目的 是 使 其 他 


ee 下 面 ， 我 们 分 别 来 


Collections 中 有 一 组 方法 ， 返 回 一 个 不 包含 任何 元 素 的 容器 接口 
对 象 ， 如 下 所 示 : 


public static final <T> List<T> emptyList() 
public static final <T> Set<T> emptySet() 
public static final <K,V> Map<K,V> emptyMap() 
public static <T> Iterator<T> emptyIterator() 


分 别 返 回 一 个 空 的 List、Set、Map 和 Iterator 对 象 。 比 如 ， 可 以 这 
么 用 : 


List<String> list = Collections .emptyList()， 
Map<String, Integer> map = Collections ,emptyMap() ， 


Set<Integer> Set = Collections.emptySet(); 


一 个 空 容器 对 象 有 什么 用 呢 ? 空 容器 对 象 经 第 用 作 方 法 返回 值 。 
比如 ， 有 一 个 方法 ， 可 以 将 可 变 长 度 的 整数 转换 为 一 个 List， 方 法 声 


public static List<Integer> asList(int... elements) 


在 参数 为 空 时 ， 这 个 方法 应 该 返回 null 还 是 一 个 空 的 List 呢 ?如 果 
a 方法 调用 者 必须 进行 检查 ， 然后 分 别处 理 ， ，” 代 向 结构 大 概 
0 下 所 示 : 


int[] arr = ..; // 从 别 的 地 方 获 取 到 的 arr 
List<Integer> list = asList(arr); 
if(1ist==nul1){ 

LL 


}elsef{ 
//... 


} 


这 段 代码 比较 烦琐 ， 而 且 如 果 不 小 心 款 记 检 查 ， 则 有 可 能 会 抛 出 
空 指 针 异 常 ， 所 以 推荐 做 法 是 返回 一 个 空 x 的 List， 以 便 调 用 者 安全 地 
进行 统一 处 理 ， 比 如 ，asList 可 以 这 样 实现 ; 


public static List<Integer> asList(int... elements){ 
if(elements.length==0){ 
return Collections.emptyList(); 
List<Integer> list = new ArrayList<>(elements.1length); 
for(int e : elements){ 
list.add(e); 


return list; 


返回 一 个 空 的 List。 也 可 以 这 样 实 


return new ArrayList<Integer>(); 


这 与 emptyList 方 法 有 什么 区 别 呢 ? emptyList 方 法 返回 的 是 一 个 静 
态 不 可 变 对 象 ， 它 可 以 节省 创建 渐 对 象 的 内 存 和 时 间 开 销 。 我 们 来 看 
下 emptyList 方 法 的 具体 定义 : 


public static final <T> List<T> emptyList() { 
return (List<T>) EMPTY_LIST， 
} 


EMPTY_LIST 的 定义 为 : 


public static final List EMPTY_LIST = new EmptyList<>(); 


是 一 个 静态 不 可 变 对 象 ， 类 型 为 EmptyList， 它 是 一 个 私有 静态 内 
部 类 ， 继 承 自 Abstract-List， 主 要 代码 为 : 


private static class EmptyList<E> 
extends AbstractList<E> 
implements RandomAccess { 
public Iterator<E> iterator() { 
return emptyIterator(); 


public ListIterator<E> listIterator() { 
return emptyListIiterator(); 


public int size() {return 0;} 
public boolean isEmpty() {return true;} 
public boolean contains(Object obj) {return false;} 
public boolean containsAll(Collection<?> c) { return c.isEmpty(); } 
public Object[] toArray() { return new Object[0]; } 
public <T> T[] toArray(T[] a) { 

if(a.length > 0) 

a[90] = null; 

return a; 
} 
public E get(int index) { 

throw new IndexOutofBoundsException("Index: "+index); 


} 
public boolean equals(Object o) { 
return (o instanceof List) && ((List<?>)0).isEmpty(); 


public int hashCode() { return 1; } 


7 » 


emptylterator 和 emptyListlterator 返 回 空 的 迭代 絮 。emptyIterator 的 
代码 为 : 


public static <T> Iterator<T> emptyIterator() { 
return (Iterator<T>) EmptyIterator .EMPTY_ITERATOR; 
} 


EmptyIterator 是 一 个 静态 内 部 类 ， 代 码 为 : 


private static class EmptyIterator<E> implements Iterator<E> { 
static final EmptyIterator<Object> EMPTY_ITERATOR 
= new EmptyIterator<>(); 
public boolean hasNext() { return false; } 
public E next() { throw new NoSuchElementException(); } 
public void remove() { throw new IllegalStateException(); } 


} 


以 上 这 些 代码 都 比较 人 简单， 就 不 资 述 了 。 需 要 注意 的 是 ， 
EmptyList 不 文 持 修改 操作 ， 比 如 : 


Collections.emptyList().add("hello"); 


会 抛 出 异常 UnsupportedOperationFException 。 


如 果 返 回 值 只 是 用 于 读 取 ， 可 以 使 用 emptyList 方 法 ， 但 如 果 返 回 
值 还 用 于 写 入 ， 则 需要 新 建 一 个 对 象 。 其 他 衬 容 需 方 法 与 emptyList 方 
法 类 似 ， 我 们 束 不 性 述 了 。 它 们 都 可 以 被 用 于 方法 返回 值 ， 以 便 调 用 
者 统一 进行 处 理 ， 同 时 和 省 时 间 和 内 存 开 销 ， 它 们 的 共同 限制 是 返回 
值 不 能 用 于 写 入 。 我 们 将 空 容 器 方法 看 作 适 配器 ， 是 因为 它 将 null 
或 “ 空 ”转换 为 了 容 絮 对 象 。 


需要 说 明 的 是 ， 在 Java 9 中 ， 可 以 使 用 List、Map 和 Set 不 带 参 数 的 
0 也 就 是 说 ， 如 下 两 行 代 码 的 效果 
是 相同 的 : 


1. List list = Collections .emptyList()， 
2， List list = List.of(); 


2. 单 一 对 象 方法 


Collections 中 还 有 一 组 方法 ， 可 以 将 一 个 单独 的 对 象 转换 为 一 个 
标准 的 容器 接口 对 象 ， 比 如 : 


public static <T> Set<T> singleton(T 0) 
public static <T> List<T> singletonList(T 0) 
public static <K,V> Map<K,V> singletonMap(K key, V value) 


比如 ， 可 以 这 么 用 : 


Collection<String> coll = Collections.singleton(" 编 程 " )，; 
Set<String> set = Collections. singleton( "编程" ); 

List<String> list = Collections. singletonList(" 老 马 "); 
Map<String，String> map = Collections.singletonMap(" 老 马 "， "编程 ")，; 


这 些 方法 也 经 常用 于 构建 方法 返回 值 ， 相 比 狐 建 容 絮 对 象 并 添加 
元 素 ， 这 些 方 法 更 为 简洁 方便 ， 此 外 ， 它 们 的 实现 更 为 高 效 ， 它 们 的 
实现 类 都 针对 单一 对 象 进行 了 优化 。 比 如 ，singleton 方 法 的 代码 : 


public static <T> Set<T> singleton(T 0) { 
return new SingletonSet<>(0); 
} 


渐 建 了 一 个 SingletonSet 对 象 ，SingletonSet 是 一 个 静态 内 部 类 ， 主 
要 代码 为 : 


private static class SingletonSet<E> 
extends AbstractSet<E> { 
private final E element ， 
SingletonSet(E e) {element = e;} 
public Iterator<E> iterator() { 
return SingletonIterator(element ) ， 


public int size() {return 1;} 
public boolean contains(Object 0) {return eq(o, element);} 


singletonIterator 是 一 个 内 部 方法 ， 将 单一 对 象 转换 为 了 一 个 友 代 
怖 接口 对 象 ， 代 人 码 为 : 


static <E> Iterator<E> SingletonIterator(final E e) { 
return new Iterator<E>() { 
private boolean hasNext = true; 
public boolean hasNext() { 
return hasNext,; 


public E next() { 

if(hasNext) { 
hasNext = false,; 

return e; 


throw new NoSuchElementException(); 


public void remove() { 
throw new UnsupportedoperationException( ) ， 
} 


}; 
} 


ed 方法 吏 是 比较 两 个 对 象 是 否 相同 ， 考 虑 了 null 的 情况 ， 代 码 为 : 


static boolean eq(Object o1, Object 02) { 
return o1==null ? 02==null : o1.equals(o0o2); 
} 


需要 注意 的 是 ，singleton 方 法 返回 的 也 是 不 可 变 对 象 ， 只 能 用 于 
读 取 ， 写 入 会 抛 出 UnsupportedOperationException 寞 常 。 其 他 
singletonXXX 方 法 的 实现 思路 是 类 似 的 ， 返 回 值 也 都 只 能 用 于 读 取 
不 能 写 入 ， 我 们 融 不 属 述 了 。 


除了 用 于 构建 返回 值 ， 这 些 方法 还 可 用 于 构建 方法 参数 。 比 如 ， 
从 容器 中 删除 对 象 ，Collection 有 如 下 方法 : 


boolean remove(Object 0o); 
boolean removeAll(Collection<?> C)， 


remove 方 法 只 会 删除 第 一 条 匹配 的 记录 ，removeAll 方 法 可 以 删除 
所 有 匹配 的 记录 ， 但 需要 一 个 容 妮 接口 对 象 ， 如 果 需 要 从 一 个 List 中 
删除 所 有 匹配 的 某 一 对 象 呢 ? 这 时 ， 融 可 以 使 用 Collections.singleton 封 
竣 这 个 要 删除 的 对 象 °。 比 如， 从 list 中 删除 所 有 的 "b"， 代 码 如 下 所 
和 小: 


List<String> list = new ArrayList<>(); 
Collections.addAll(1list, "a", "b", "c", "d", "b"); 
list.removeAll(Collections.singleton("b")); 
System.out.println(1ist),; 


需要 说 明 的 是 ， 在 Java 9 中 ， 可 以 使 用 List、Map 和 Set 的 of 方法 达 
到 singleton 同 样 的 功能 ， 也 吏 是 说 ， 如 下 两 行 代码 的 效果 是 相同 的 : 


1，Set<String> b 
2，Set<String> b 


Collections,.singleton("b"); 
Set.of("b"); 


除了 以 上 两 组 方法 ，Collections 中 还 有 如 下 天 配器 方法 ， 用 的 相 
对 较 少 ， 我 们 或 不 详细 介绍 了 。 


// 将 Map 接 口 转换 为 Set 接 
public static <E> Set<E> newSetFromMap(Map<E,Boolean> map) 
// 将 Deque 接 口 转换 为 后 进 先 出 的 队列 接 
public static <T> Queue<T> asLifoQueue(Deque<T> dedue) 
// 返 回 包含 n 个 相同 对 象 o 的 List 接 
public static <T> List<T> nCopies(int n, T 0) 


12.2.5 ”装饰 器 


装饰 絮 接 受 一 个 接口 对 象 ， 并 返回 一 个 同样 接口 的 对 象 ， 不 过 ， 
新 对 象 可 能 会 扩展 一 些 新 的 方法 或 属性 ， 扩 展 的 方法 或 属性 就 古 所 请 
的 “ 洲 饰 "”， 也 可 能 会 对 原 有 的 接口 方法 做 一 些 修 改 ， 达 到 一 定 的 “ 洲 
炳 "目的 。Collections 有 三 组 厂 贤 韦 方 法， 它们 的 返回 对 象 都 没有 新 的 
方法 或 属性 ， 但 改变 了 原 有 接口 方法 的 性 质 ， 经 过 “ 闭 贤 "后 ， 它 们 更 
具体 分 别 是 写 安 全 、 类 型 安全 和 线程 安全 ， 我 们 分 别 来 看 


1. 写 


全 


写 安 全 的 主要 方法 有 : 


闪 


public static <T> Collection<T> unmodifiableCollection( 
Collection<? extends T> c) 
public static <T> List<T> unmodifiableList(List<? extends T> list) 
public static <K,V> Map<K,V> unmodifiableMap(Map<? extends K, ? extends V> m) 
public static <T> Set<T> unmodifiableSet(Set<? extends T> s) 


顾名思义 ， 这 组 unmodifiableXXX 方 法 束 是 使 容器 对 象 变 为 只 读 
的 ， 写 入 会 抛 出 UnsupportedOperationException 异 常 。 为 什么 要 变 为 只 


读 的 呢 ? 典型 场景 是 : 需要 传递 一 个 容器 对 象 给 一 个 方法 ， 这 个 方法 
可 能 是 第 三 方 提供 的 ， 为 避免 第 三 方 误 写 ， 所 以 在 传递 前 ， 变 为 只 读 
的 ， 如 下 所 示 : 


public static void thirdMethod(Collection<String> c){ 
c.add("bad"); 


public static void mainMethod(){ 
List<String> list = new ArrayList<>(Arrays.asList( 
new String[]{"a", "pb, VC "d"})); 
thirdMethod(Collections.unmodifiableCollection(1ist)); 


这 样 ， 调 用 束 会 触发 异常 ， 从 而 避免 了 将 错误 数据 插入 。 


这 些 方法 是 如 何 实现 的 呢 ? 每 个 方法 内 部 都 对 应 一 个 类 ， I 
实现 了 对 应 的 容器 接口 ， 它 内 部 是 待 效 师 的 对 象 ， 只 读 方法 传递 给 这 
个 内 部 对 象 ， 写 方法 抛 出 异 背 。 比 如 ，unmodifiableCollection 方 法 的 代 
人 码 为 : 


public static <T> Collection<T> unmodifiableCollection( 
Collection<? extends T> c) { 
return new UnmodifiableCollection<>(c); 


UnmodifiableCollection 是 一 个 静态 内 部 类 ， 代 码 为 : 


static class UnmodifiableCollection<E> implements Collection<E>, 

Serializable { 
private static final long serialVersionUID = 1820017752578914078L; 
final Collection<? extends E> c; 
UnmodifiableCollection(Collection<? extends E> c) { 

if(c==null) 

throw new NullpointerException(); 
this.c = c; 


public int size() {return c.size();} 
public boolean isEmpty() {return c.isEmpty();} 
public boolean contains(Object 0o) {return c.contains(o);} 
public Object[] toArray() {return c.toArray();} 
public <T> T[] toArray(T[] a) {return c.toArray(a);} 
public String toString() {return c.toSstring();} 


public Iterator<E> iterator() { 
return new Iterator<E>() { 
private final Iterator<? extends E> i = c.iterator(); 
public boolean hasNext() {return i,.hasNext();} 
public E next() {return i.next();} 


public void remove() { 
throw new UnsupportedoperationException( ) ， 
} 


}; 


} 
public boolean add(E e) { 
throw new UnsupportedoperationException( ); 


} 
public boolean remove(Object o) { 
throw new UnsupportedOoperationException(); 


public boolean containsAll(Collection<?> coll) { 
return c.containsAll(coll]); 


} 
public boolean addAll(Collection<? extends E> coll) { 
throw new UnsupportedOoperationException(); 


public boolean removeAll(Collection<?> coll) { 
throw new UnsupportedOoperationException(); 


} 
public boolean retainAll(Collection<?> coll) { 
throw new UnsupportedOperationException(); 


} 
public void clear() { 

throw new UnsupportedOoperationException(); 
} 


} 


代码 比较 简单 ， 其 他 unmodifiableXXX 方 法 的 实现 也 者 类似， 我 们 
驶 不 葡 述 了 。 


2. 类 型 安全 


所 谓 类 型 安全 是 指 确保 容 刀 中 不 会 保存 错误 类 型 的 对 象 。 容 禹 怎 
么 会 允许 保存 错误 类 型 的 对 象 呢 ? 我 们 看 段 代 码 : 


List list = new ArrayList<Integer>(); 
list.add("hello"); 
System.out.println(1ist),; 


我 们 创建 了 一 个 Integer 类 型 的 List 对 象 ， 但 添加 了 字符 串 类 型 的 对 
象 "hello"， 编 译 没有 错误 ， 运 行 也 没有 异常 ， 程 序 输出 为 "[hello]"。 


之 所 以 会 出 现 这 种 情况 ， 征 因为 Java 是 通过 欣 除 来 实现 泛 型 的 ， 
而 且 类 型 参数 是 可 选 的。 正常 情 况 下 ， 我 们 会 加 上 类 型 参数 ， 让 泛 型 
机 制 来 保证 类 型 的 正确 性 。 但 是 ， 由 于 泛 型 是 Java 5 以 后 才 加 入 的 ， 之 
前 的 代码 可 能 没有 类 型 参数 ， 而 新 的 代码 可 能 需要 与 老 的 代码 互动 。 


为 了 避免 老 的 代码 用 错 类 型 ， 确 保 在 汉 型 机 制 失 灵 的 情况 下 类 型 
人 以 在 传递 容器 对 象 给 老 代 码 之 前 ， 使 用 类 似 如 下 方法 “ 装 
上 2 : 


public static <E> List<E> checkedList(List<E> list, Class<E> type) 
public static <K，V> Map<K, V> checkedMap(Map<K, V> m, 

Class<K> keyType, Class<V> valueType) 
public static <E> Set<E> checkedSet(Set<E> s, Class<E> type) 


使 用 这 组 checkedXXX 方 法 ， 部 需要 传递 类 型 对 象 ， 这 些 方法 都 会 
使 容器 对 象 的 方法 在 运行 时 检查 类 型 的 正确 性 ， 如 采 不 匹配 ， 会 抛 出 


ClassCastException 异 常 。 比 如 : 


List list = new ArrayList<Integer>(); 
list = Collections.checkedList(1list, Integer.class); 
list.add("hello"); 


这 次 ， 运 行 吏 会 抛 出 异 币 ， 从 而 避免 错误 类 型 的 数据 插入 : 


java.lang.ClassCastException: Attempt to insert class java.lang.String element 
into collection with element type class java.lang.Integer 


这 些 checkedXXX 方 法 的 实现 机 制 是 类 似 的 ， 每 个 方法 内 部 都 对 应 
一 个 类 ， 这 个 类 实现 了 对 应 的 容器 接口 ， 它 内 部 是 待 装饰 的 对 象 ， 大 
部 分 方法 只 是 传递 给 这 个 内 部 对 象 ， 但 对 添加 和 修改 方法 ， 会 首先 进 
行 类 型 检查 ， 类 型 不 匹配 会 抛 出 异常 ， 类 型 匹配 才 传 递 给 内 部 对 象 。 
以 checkedCollection 为 例 ， 我 们 来 看 下 代码 : 


public static <E> Collection<E> checkedCollection( 
Collection<E> c, Class<E> type) { 
return new CheckedCollection<>(c, type); 


} 


CheckedCollection 是 一 个 静态 内 部 类 ， 主 要 代码 为 : 


static class CheckedCollection<E> implements Collection<E>, Serializable { 
private static final long serialVersionUID = 1578914078182001775L; 
final Collection<E> c; 
final Class<E> type; 


void typeCheck(Object 0) { 
If(o != null && !type.isInstance(o)) 
throw new ClassCastException(badElementMsg(o)); 


} 


private String badElementMsg(Object o) { 
return "Attempt to insert " + Oo.getClass() + 
" element into collection with element type " + type; 


} 
CheckedCollection(Collection<E> c, Class<E> type) { 
if(c==null || type == null) 
throw new NullPointerException(); 
this.c = c; 
this,type = type; 
} 
public int size() 
public boolean isEmpty() return c.isEmpty(); } 
public boolean contains(Object 0o) return c.contains(o); } 


{ return c 
{ G 
{ c 
public Object[] toArray() { return c.toArray(); } 
{ c 
{ C 
{ C 


.Size(); } 


public <T> T[] toArray(T[] a) return c.toArray(a); } 
public String toString() return c.tostring(); } 
public boolean remove(Object 0) return c.remove(o); } 
public void clear() { c.clear(); } 
public boolean containsAll(Collection<?> coll) { 

return c.containsAll(col1l]); 


public boolean removeAll(Collection<?> coll) { 
return c,removeA]l1(col1)， 


} 
public boolean retainAll(Collection<?> coll) { 
return c.retainAll(coll),; 


public Iterator<E> iterator() { 
final Iterator<E> it = c,.iterator(); 
return new Iterator<E>() { 
public boolean hasNext() { return it.hasNext(); } 
public E next() { return it.next(); } 
public void remove() { it.remove(); }}; 


} 

public boolean add(E e) { 
typeCheck(e); 
return c.add(e); 


代码 比较 简单 ，add 方 法 中 ， 会 先 调 用 typeCheck 进 行 类 型 检查 。 
其 他 checkedXXX 方 法 的 实现 也 都 类 似 ， 我 们 就 不 袭 述 了 。 


3 线程 安全 


关于 线程 ， 我 们 后 续 草 世 会 详细 介绍 ， 这 里 简要 说 明 下 。 之 前 我 
们 介绍 的 各 种 容器 类 基本 都 不 是 线程 安全 的 ， 也 束 古 说 ， 如 果 多 个 线 
程 同 时 读 写 同一 个 容 船 对象 ， 是 不 安全 的 。Collections 提 供 了 一 组 方 
法 ， 可 以 将 一 个 容器 对 象 变 为 线程 安全 的 ， 比 如 : 


public static <T> Collection<T> synchronizedCollection(Collection<T> c) 
public static <T> List<T> synchronizedList(List<T> list) 

public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) 

public static <T> Set<T> synchronizedSet(Set<T> s) 


需要 说 明 的 是 ， 这 些 方法 都 是 通过 给 所 有 容器 方法 加 锁 来 实现 
的 ， 这 种 实现 并 不 是 最 优 的 。Java 提 供 了 很 多 专门 针对 并 发 访问 的 容 
右 类 ， 我 们 在 第 17 章 介绍 。 


12.26 小 结 


本 世 介 绍 了 类 Collections 中 的 两 类 操作 。 第 一 类 操作 是 一 些 通 用 
算法 ， 包 括 查 找 、 奉 换 、 排 序 、 调 整 顺序 、 添 加 、 修 改 等 ， 这 些 算法 
操作 的 都 旦 容 亏 接口 对 象 ， 这 是 面 癌 接口 编程 的 一 种 体现 ， 只 要 对 象 
实现 了 这 些 接 口 ， 就 可 以 使 用 这 些 算 法 。 第 二 类 操作 都 返回 一 个 容器 
接口 对 象 ， 这 些 方法 代表 两 种 设计 模式 ， 一 种 是 适配器 ， 男 一 种 是 效 
饰 顺 ， 我 们 介绍 了 这 两 种 设计 模式 ， 以 及 这 些 方法 的 用 法 、 适 用 场合 
和 实现 机 制 。 


12.3” 容 絮 类 忌 结 


前 面 章节 中 ， 我 们 介绍 了 多 种 容器 类 ， 本 节 进 行 简要 总 结 ， 我 们 
主要 从 三 个 角度 进行 总 结 : 


用 法 和 特点 ; 
数据 结构 和 算法 ; 
.设计 思维 和 模式 出 


12.3.1 用 法 和 特点 


图 12-1 包 含 了 容器 类 主要 的 接口 和 类 ， 我 们 还 是 用 该 图 进行 总 
结 。 容 右 类 有 两 个 根据 口 ， 分 别 是 Collection 和 Map，Collection 表 示 单 
个 元 素 的 集合 ，Map 表 示 键 值 对 的 集合 。 


Collection 表 示 的 数据 集合 有 基本 的 增 、 删 、 查 、 通 历 等 方法 ， 但 
没有 定义 元 素 间 的 顺序 或 位 置 ， 也 没有 规定 是 否 有 重复 元 素 。 


List 是 Collection 的 子 接口 ， 表 示 有 顺序 或 位 置 的 数据 集合 ， 增 加 
了 根据 索引 位 置 进行 操作 的 方法 。 它 有 两 个 主要 的 实现 类 : ArrayList 
和 LinkedList。ArrayList 基 于 数组 实现 ，LinkedList 基 于 链表 实现 ; 
ArrayList 的 随机 访问 效率 很 高 ， 但 从 中 间 插 入 和 删除 元 素 需 要 移动 元 
素 ， 效 率 比较 低 ，LinkedList 则 正好 相反 ， 随 机 访问 效率 比较 低 ， 但 增 
删 元 素 只 需要 调整 邻近 世上 点 的 链接 。 


Set 也 是 Collection 的 子 接口 ， 它 没有 增加 新 的 方法 ， 但 保证 不 含 重 
复元 素 。 它 有 两 个 主要 的 实现 类 : HashSet 和 TreeSet。HashSet 基 于 哈 
希 表 实现 ， 要 求 键 重 写 hashCode 方 法 ， 鸡 率 更 高 ， 但 元 素 间 没有 顺 
序 ; TreeSet 基 于 排序 二 又 树 实 现 ， 元 素 按 比较 有 序 ， 元 素 需 要 实现 
Comparable 接 口 ， 或 者 创建 TreeSet 时 提供 一 个 Comparator 对 象 。 
HashSet 示 有 一 个 子 类 LinkedHashSet 可 以 按 插入 有 序 。 还 有 一 个 针对 枚 
举 类 型 的 实现 类 EnumSet， 它 基于 位 向 量 实现 ， 戏 率 很 高 。 


Queue 是 Collection 的 子 接口 ， 表 示人 先进 先 出 的 队列 ， 在 尾部 添 
加 ， 从 头 部 查看 或 删除 。 Deque 是 Queue 的 子 接口 ， 表 示 更 为 通用 的 双 
端 队 列 ， 有 明确 的 在 头 或 尾 进行 查看 、 添 加 和 删除 的 方法 。 普 通 队 列 
有 两 个 主要 的 实现 类 : LinkedList 和 ArrayDeque。LinkedList 基 于 链表 
实现 ，ArrayDeque 基 于 循环 数组 实现 。 一 般 而 言 ， 如 果 只 需要 Deque 
接口 ，Array-Deque 的 效率 更 高 一 些 。 


Queue 还 有 一 个 特殊 的 实现 类 PriorityQueue， 表 示 优 先 级 队列 ， 内 
部 是 用 堆 实 现 的 。 堆 除了 用 于 实现 优先 级 队列 ， 还 可 以 高 效 方便 地 解 
决 很 多 其 他 问题 ， 比 如 求 前 K 个 最 大 的 元 素 、 求 中 值 等 。 


Map 接 口 表示 键 值 对 集合 ， 经 常 根据 键 进行 操作 ， 它 有 两 个 主要 
的 实现 类 : HashMap 和 TreeMap“。HashMap 基 于 哈 硕 表 实现 ， 要 求 键 重 
写 hashCode 方 法 ， 操 作 效 率 很 高 ， 但 元 素 没 有 顺序 。TreeMap 基 于 排 
序 二 义 树 实现 ， 要 求 键 实现 Comparable 接 口 ， 或 提供 一 个 Comparator 
对 和 象 ， 操 作 效 率 稍 低 ， 但 可 以 按键 有 序 。 


HashMap 还 有 一 个 子 类 LinkedHashMap， 它 可 以 按 揪 入 或 访问 有 
序 。 之 所 以 能 有 序 ， 是 因为 每 个 元 素 还 加 入 到 了 一 个 双 同 链表 中 。 如 
果 键 本 来 就 是 有 序 的 ， 使 用 LinkedHashMap 而 非 TreeMap 可 以 提高 效 
率 。 按 访问 有 序 的 特点 可 以 方便 地 用 于 实现 LRU 缓 存 。 


如 有 果 键 为 枚 举 类 型 ， 可 以 使 用 专门 的 实现 类 EnumMap， 它 使 用 效 
率 更 高 的 数组 实现 。 


需要 说 明 的 是 ， 除 了 Hashtable、Vector 和 Stack， 我 们 介绍 的 各 种 
容器 类 都 不 是 线程 安全 的 ， 也 束 是 说 ， 如 果 多 个 线程 同时 读 写 同一 个 
容 需 对 象 ， 是 不 安全 的 。 如 果 需 要 线程 安全 ， 可 以 使 用 Collections 提 
| 0 同步 ， 或 者 使 用 线程 安全 的 

门 容 絮 类。 


此 外 ， 容 器 类 提供 的 迭代 器 都 有 一 个 特点 ， 都 会 在 从 代 中 间 进 行 
结构 性 变化 检测 ， 如 采 容 右 发 生 了 结构 性 变化 ， 束 会 抛 出 
ConcurrentModificationException， 所 以 不 能 在 迭代 中 间 直 接 调 用 容 妖 
0 如 需 添 加 和 删除 ， 应 调用 迭代 器 的 相关 方 
Y o 


在 解决 一 个 特定 问题 时 ， 经 常 需 要 综合 使 用 多 种 容器 类 。 比如， 
要 统计 一 本 书 中 出 现 次 数 最 多 的 前 10 个 单词 ， 可 以 先 使 用 HashMap 统 
计 每 个 单词 出 现 的 次 数 ， 再 使 用 TopK 类 用 PriorityQueue 求 前 10 个 单 
词 ， 或 者 使 用 Collections 提 供 的 Sort 方法 。 


在 之 前 各 市 介绍 的 例子 中 ， 为 简 音 起见， 容器 中 的 元 素 类 型 往往 
是 简单 的 ， 但 需要 说 明 的 是 ， 它 们 也 可 以 是 复杂 的 目 定 义 类 型 ， 还 可 
以 是 容器 类 型 。 比 如 在 一 个 新 闻 应 用 中 ， 表 示 当 天 的 前 十 大 新 闻 可 以 
用 一 个 List 表 示 ， 形 如 List<News>， 而 为 了 表示 每 个 分 类 的 前 十 大 新 
闻 ， 可 以 用 一 个 Map 表 示 ， 刍 为 分 类 Category， 值 为 List<News>， 形 如 
Map<Category，List<News>>， 而 表示 每 天 的 每 个 分 类 的 前 十 大 新 
闻 ， 可 以 在 Map 中 使 用 Map， 键 为 日 期 ， 值 也 是 一 个 Map， 形 如 


Map<Date, Map<Category, List<News>>° 


12.3.2 ”数据 结构 和 算法 
在 容 絮 类 中 ， 我 们 看 到 了 如 下 数据 结构 的 应 用 : 


1) 动态 数组 :ArrayList 内 部 就 是 动态 数组 ，HashMap 内 部 的 链表 
数组 也 是 动态 扩展 的 ，ArrayDeque 和 PriorityQueue 内 部 也 都 是 动态 扩 
展 的 数组 。 


2) 链表 :，LinkedList 是 用 双向 链表 实现 的 ，HashMap 中 映射 到 同 
一 个 链表 数组 的 键 值 对 是 通过 单 向 链表 链接 起 来 的 ，LinkedHashMap 
中 每 个 元 素 还 加 入 到 了 一 个 双向 链表 中 以 维护 插入 或 访问 顺序 。 


3) 哈 布 表 : ”HashMap 是 用 哈 希 表 实 现 的 ，HashSet、 
LinkedHashSet 和 LinkedHashMap 基 于 HashMap， 内 部 当然 也 是 哈 希 
表 o 


4) 排序 二 又 树 : TreeMap 是 用 红 黑 树 (基于 排序 二 义 树 ) 实现 
的 ，TreeSet 内 部 使 用 TreeMap， 当 然 也 是 红 黑 树 ， 红 黑 树 能 保持 元 素 
的 顺序 且 综 合 性 能 很 高 。 


5) 堆 : ”PriorityQueue 是 用 堆 实 现 的 ， 堆 逻辑 上 是 树 ， 物 理 上 是 动 
态 数 组 ， 堆 可 以 高 效 地 解决 一 些 其 他 数据 结构 难以 解决 的 问题 。 


6) 循环 数组 : ArrayDeque 征 用 循环 数组 实现 的 ， 通 过 对 头 尾 变 
量 的 维护 ， 实 现 了 高 效 的 队列 操作 。 


7) 位 同 量 : EnumSet 和 BitSet 古 用 位 同 量 实现 的 ， 对 于 只 有 两 种 
状态 ， 且 需要 进行 集合 运算 的 数据 ， 使 用 位 辐 量 进行 表示 、 位 运算 进 
行 处 理 ， 精 简 且 高 效 。 


每 种 数据 结构 中 往往 包含 一 定 的 算法 策略 ， 这 种 策略 往往 是 一 种 
折 中 ，。 比 如: 


1) 动态 扩展 算法 : 动态 数组 的 扩展 策略 ， 一 般 是 指数 级 扩展 的 ， 
征 在 两 方面 进行 平衡 ， 一 方面 是 希望 减少 内 存 消耗 ， 必 一 方面 希望 减 
少 内 存 分 配 、 移 动 和 复制 的 开销 。 


2) 哈 希 算法 : 哈 布 表 中 键 映 射 到 链表 数组 索引 的 算法 ， 算 法 要 
， 同 时 要 尽量 随机 和 均匀 。 


3) 排序 二 又 树 的 平衡 算法 : 排序 二 又 树 的 平衡 非常 重要 ， 红 黑 树 
是 一 种 平衡 算法 ，AVL 树 是 男 一 种 平衡 算法 。 平 衡 算法 一 方面 要 保证 
尽量 平衡 ， 另 一 方面 要 尽量 减少 综合 开销 。 

Collections 实 现 了 一 些 通用 算法 ， 比 如 二 分 查找 、 排 序 、 翻 转 列 


表 顺 序 、 随 机 化 重 排 等 ， 在 实现 大 部 分 算法 时 ，Collections 也 都 根据 
容器 大 小 和 是 否 实现 了 RandomAccess 接 口 采 用 了 不 同 的 实现 方式 。 


二 


12.3.3 ”设计 思维 和 模式 


上 在 容器 类 中 ， 我 们 也 看 到 了 Java 的 多 种 语言 机 制 和 设计 思维 的 运 


1) 封装 ， 封装 就 是 提供 简单 接口 ， 并 隐藏 实现 细节 ， 这 是 程序 
设计 的 最 重要 思维 。 在 容器 类 中 ， 很 多 类 、 方 法 和 变量 都 是 私有 的 ， 
比如 迭代 器 方法 ， 基 本 都 是 通过 私有 内 部 类 或 匿名 内 部 类 实现 的 。 


2) 继承 和 多 态 : 继承 可 以 复 用 代码 ， 便 于 按 父 类 统一 处 理 ， 但 
继承 是 一 把 双 刃 剑 。 在 容器 类 中 ，Collection 是 父 接口 ，LisVSeVQueue 
继承 目 Collection， 通 过 Collection 接 口 可 以 统一 处 理 多 种 类 型 的 集合 对 


象 。 容 器 类 定义 了 很 多 抽象 容器 类 ， 具 体 类 通过 继承 它们 以 复 用 代 
码 ， 每 个 抽象 容 絮 类 都 有 详细 的 文档 说 明 ， 描 述 其 实现 机 制 ， 以 及 于 
类 应 该 如 何 重 写 方法 。 容 器 类 的 设计 展示 了 接口 继承 、 类 继承 ， 以 及 
抽象 类 的 恰当 应 用 。 


3) 组 合 一 般 而 言 ， 组 合 应 该 优先 于 继承 ， 我 们 看 到 HashSet 通 
过 组 合 的 方式 使 用 HashMap，TreeSet 通 过 组 合 使 用 TreeMap， 适 配 姨 
和 装饰 妖 模 式 也 都 是 通过 组 合 实现 的 。 


4) 接口 : 面向 接口 编程 是 一 种 重要 的 思维 ， 可 降低 代码 则 的 灶 
合 ， 提 高 代码 复 用 程度 ， 在 容 右 类 方法 中 ， 接 受 的 参数 和 返回 值 往往 
都 是 接口 ，Collections 提 供 的 通用 算法 ， 操 作 的 也 都 是 接口 对 象 ， 我 
们 平时 在 使 用 容器 类 时 ， 一 般 也 只 在 创建 对 象 时 使 用 具体 类 ， 而 其 他 
地 方 都 使 用 接口 。 


5) 设计 模式 我 们 在 容 禹 类 中 看 到 了 迭代 舌 、 工 三 方法 、 适 配 
俐 、 装 饰 絮 等 多 种 设计 模式 的 应 用 。 


本 节 从 用 法 和 特点 、 数 据 结 构 和 算法 以 及 设计 思维 和 模式 三 个 角 
度 简要 总 结 了 之 前 介绍 的 各 种 容 右 类。 至此， 关于 容 右 类 束 介 绍 完 
了 。 到 目前 为 止 ， 我 们 还 没有 接触 过 文件 处 理 ， 而 我 们 在 日 第 的 计算 
机 操作 中 ， 接 触 最 多 的 吏 是 各 种 文件 了 ， 让 我 们 从 下 一 章 开 始 ， 一 起 
探讨 文件 操作 。 


第 四 部 分 文件 
第 13 章 文件 基本 技术 
第 14 章 文件 高 级 技术 


第 13 草 ”文件 基本 技术 


我 们 在 日 常 计算 机 操作 中 ， 接 触 和 处 理 最 多 的 ， 除 了 上 网 ， 大 概 
忠 是 各 种 各 样 的 文件 了 ， 从 本 草 开 始 ， 我 们 束 来 探讨 文件 处 理 。 文 件 
处 理 的 内 容 比较 多 ， 我 们 先 在 13.1 节 进行 概述 ， 并 介绍 后 续 章 节 的 安 


13.1 文件 概述 


在 本 方 ， 我 们 主要 介绍 文件 有 关 的 一 些 基 本 概念 和 常识 ，Java 中 处 
理 文件 的 基本 思路 和 类 结 构 ， 以 及 接 下 来 的 章 世 安排 。 


13.1.1 基本 概念 和 第 识 


下 面 ， 我 们 移 介 绍 一 些 基 本 概念 和 第 识 ， 包 括 二 进 制 思维 、 文 件 
类 型 、 文 本 文件 的 编码 、 文 件 系 统 和 文件 读 写 等 。 


1. 二 进 制 思维 


为 了 透彻 理解 文件 ， 我 们 首先 要 有 一 个 二 进 制 思维 。 所 有 文件 ， 
不 论 是 可 执行 文件 、 图 片 文件 、 视 频 文 件 、Word 文 件 、 压 缩 文件 、txt 
文件 ， 都 没什么 可 神秘 的 ， 它 们 都 是 以 0 和 1 的 二 进 制 形式 保存 的 。 我 
ee 


作为 程序 员 ， 我 们 应 该 有 一 个 编辑 器 ， 能 查看 文件 的 二 进 制 形 
式 ， 比 如 UltraEdit， 它 文 持 以 十 六 进 制 进行 查看 和 编辑 。 比 如 ， 一 个 文 
本 文件 ， 看 到 的 内 容 为 : 


hello，123， 浇 马 


打开 十 六 进 制 编辑 ， 看 到 的 内 容 如 图 13-1 所 示 。 


自动 换行 ” 列 模式 十 六 进 制 编辑 查找 文本 


人 


00000000h: 68 65 6C 6C 6F 2C 20 31 32 33 2C 20 区 8 80 81 E9 ; hello, 123, B..é 
00000010h: A9 AC ; © 


图 13-1 使 用 UltraEdit 查 看 十 六 进 制 


左边 的 部 分 就 是 其 对 应 的 十 六 进 制 ，"hello" 对 应 的 十 六 进 制 
是 "68656C 6C 6F"， 对 应 ASCII 码 编号 "104101108108111"，" 马 "对 应 的 
十 六 进 制 是 "E9A9AC"， 这 是 " 蕊 "的 UTF-8 编 码 。 


2. 文 件 类 型 


虽然 所 有 数据 都 是 以 二 进 制 形式 保存 的 ， 但 为 了 方便 处 理 数据 ， 
高 级 语言 引入 了 数据 类 型 的 概念 。 文 件 处 理 也 类 似 ， 所 有 文件 都 是 以 
人 
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文件 类 型 通常 以 扩展 名 的 形式 体现 ， 比 如 ，PDF 文 件 类 型 的 扩展 名 
征 .pdf， 图 片 文 件 的 一 种 利 见 扩展 名 是 jpg， 压缩 文件 的 一 种 币 见 扩展 
名 是 .zip。 每 种 文件 类 型 都 有 一 定 的 格式 ， 代 表 着 文件 含义 和 二 进 制 之 
间 的 映射 和 关系。 比如 一 个 Word 文 件 ， 其 中 有 文本 、 图 片 、 表 格 ， 文 本 
可 能 有 颜色 、 字 体 、 字 号 等 ，doc 文 件 类 型 就 定义 了 这 些 内 容 和 二 进 制 
表示 之 间 的 映射 天 系 。 有 的 文件 类 型 的 格式 是 公开 的 ， 有 的 可 能 是 私 
有 的 ， 我 们 也 可 以 定义 目 己 私 有 的 文件 格式 。 


对 于 一 种 文件 类 型 ， 往 往 有 一 种 或 多 种 应 用 程序 可 以 解读 它 ， 进 
行 查 看 和 编辑 ， 一 个 应 用 程序 往往 可 以 解读 一 种 或 多 种 文件 类 型 。 在 
操作 系统 中 ， 一 种 扩展 名 往往 关联 一 个 应 用 程序 ， 比 如 .doc 后 缀 关联 
Word 应 用 。 用 户 通 过 双击 试图 打开 茶 扩 展 名 的 文件 时 ， 操 作 系 统 查 找 
ne 


需要 说 明 的 是 ， 给 文件 加 正确 的 扩展 名 是 一 种 惯例 ， 但 并 不 是 强 
制 的 ， 如 果 扩 展 名 和 文件 类 型 不 匹配 ， 应 用 程序 试图 打开 该 文件 时 可 
能 会 报错 。 男 外 ， 一 个 文件 可 以 选择 使 用 多 种 应 用 程序 进行 解读 ， 在 
操作 系统 中 ， 一 般 通 过 右键 单 击 文件 ， 选 择 打开 方式 即 可 。 


文件 类 型 可 以 粗略 分 为 两 类 ， 一 类 是 文本 文件 ， 男 一 类 是 二 进 制 
文件 。 文 本 文件 的 例子 有 普通 的 文本 文件 .txt) ， 程 序 源 代码 文件 
(java) 、HTML 文 件 .html) 等 ， 二 进 制 文件 的 例子 有 压缩 文件 


.Zip) 、PDF 文 件 (.pdf) 、MP3 文 件 (.mp3) 、Excel 文 件 (.xlsx) 


和 。 
二 


基本 上 ， 文 本 文件 里 的 每 个 二 进 制 字 世 都 是 肝 个 可 打印 字符 的 一 
部 分 ， 都 可 以 用 最 基本 的 文本 编辑 器 进行 查看 和 编辑 ， 如 Windows 上 的 
notepad、Linux 上 的 vi。 0 PF， 每 个 字 市 就 不 一 定 表示 字符 ， 
可 能 表示 颜色 、 字 体 、 小 等 ， 如 果 用 基本 的 文本 编辑 器 打开 ， 
一 般 都 是 满 屏 的 乱码 ， 需要 似 | ] 的 应 用 程序 进行 查看 和 编辑 。 


3. 文 本 文件 的 编码 


对 于 文本 文件 ， 我 们 还 必须 注意 文件 的 编码 方式 。 文 本 文件 中 包 
含 的 基本 都 是 可 打印 字符 ， 但 字符 到 二 进 制 的 映射 〈 即 编码 ) 却 有 多 
种 方式 ， 如 GB18030、UTEF-8， 我 们 在 第 2 章 详 细 介 绍 过 各 种 编码 ， 这 
里 就 不 警 述 了 


对 于 一 个 给 定 的 文本 文件 ， 它 采用 的 是 什么 编码 方式 呢 ? 一 般 而 
言 ， 我 们 是 不 知道 的 。 那 应 用 福 序 用 什么 编码 方式 进行 解读 呢 ? 一 般 
使 用 某 种 默认 的 编码 方式 ， 可 能 是 应 用 程序 默认 的 ， 也 可 能 是 操作 系 
统 默认 的 ， 当 然 也 可 能 采用 一 些 比较 智能 的 算法 自动 推 新 编码 方式 。 


对 于 UTF-8 编 码 的 文件 ， 我 们 需要 特别 说 明 。 有 一 种 方式 ， 可 以 标 
记 该 文件 是 UTF-8 编 码 的 ， 那 就 是 在 文件 最 开头 加 入 三 个 特殊 字 节 
(0xEF 0xBB 0xBF) ， 这 三 个 特殊 字 贡 被 称 为 BOM 头 ，BOM 是 Byte 
Order Mark ( 即 字 节 序 标记 ) 的 缩写 。 比 如 ， 对 前 面 的 hello.txt 文 件 ， 
带 BOM 尖 的 UTF-8 编 码 的 十 六 进 制 形式 如 图 13-2 所 示 。 
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十 六 进 制 编 加 


hello.txt 四 


人 


00000000h: EF BB BF 68 65 6C 6C 6F 2C 20 31 32 33 2C 20 E8 ; ..hello，123，e 
00000010h: 80 81 E9 A9 AC ; 。.eEO- 


图 13-2” 带 BOM 头 的 文件 


图 13-1 和 图 13-2 所 示 都 是 UIF-8 编 码 ， 看 到 的 字符 内 容 也 一 样 ， 但 
二 进 制 内 容 不 一 样 ， 一 个 带 BOM 头 ， 一 个 不 带 BOM 头 。 


需要 注意 的 是 ， 不 是 所 有 应 用 程序 都 支持 带 BOM 头 的 UTF-8 编 码 
文件 ， 比 如 PHP 就 不 支持 BOM， 如 果 PHP 源 代码 文件 带 BOM 涉 ，PHP 


运行 驳 会 出 错 。 碰 到 这 种 问题 时 ， 前 面 介绍 的 二 进 制 思维 束 特 别 重 
和 要， 不 要 只 有 文件 的 显示 这 要 有 允 件 表 司 的 一 进 州 


另外 ， 我 们 需要 说 明 下 文本 文件 的 换行 符 。 在 Windows 系 统 中 ， 换 
行 符 一 般 是 两 个 字符 "\rn"， 即 ASCII 码 的 13 (N) 和 10 (\n') ,在 
Linux 系 统 中 ， 换 行 符 一 般 是 一 个 字符 "\n"。 


4. 文 件 系 统 


文件 一 般 是 放 在 硬盘 上 的 ， 一 个 机 器 上 可 能 有 多 个 硬盘， 但 各 种 
操作 系统 都 会 隐藏 物理 硬盘 概念 ， 提 供 一 个 逻辑 上 的 统一 结构 。 在 
Windows 中 ， 可 以 有 多 个 逻辑 盘 ， 如 C、D、E 等 ， 每 个 盘 可 以 被 格式 化 
为 一 种 不 同 的 文件 系统 ， 和 常见 的 文件 系统 有 FAT32 和 NTFS。 在 Linux 
中 ， 只 有 一 个 逻辑 的 根 目录 ， 用 斜 线 /表示 。Linux 支 持 多 种 不 同 的 文件 
系统 ， 如 Ext2/Ext3/Ext4 等 。 不 同 的 文件 系统 有 不 同 的 文件 组 织 方式 、 
结构 和 特点 ， 不 过 ， 一 般 编程 时 ， 语 言 和 类 库 为 我 们 提供 了 统一 的 
API， 我 们 并 不 需要 关心 其 细 世 。 


在 逻 错 上 ，Windows 中 有 多 个 根 目 未 ，Linux 中 有 一 个 根 目 永 ， 
个 根 目 未 下 有 一 柜子 目 永 和 文件 构成 的 树 。 每 个 文件 都 有 文件 路 径 的 
概念 ， 路 径 有 两 种 形式 ， 一 种 是 绝对 路 径 ， 另 一 种 是 相对 路 径 。 


所 谓 绝对 路 径 ， 是 从 根 目 永 开始 到 当前 文件 的 完整 路 径 ， 在 
Windows 中 ， 目 了 永 之 间 用 反 斜 线 分 隔 ， 如 C: \code\hello.java， 在 Linux 
中 ， 目 录 之 间 用 和 斜 线 分隔 ， 如 /Users/laoma/Desktop/code/hello.java。 在 
Java 中 ，java.io.File 类 定义 了 一 个 静态 变量 File.separator， 表 示 路 径 分 隔 


件 ， 编 程 时 应 使 用 该 变量 而 避免 便 编 码 。 


所 谓 相 对 路 径 ， 是 相对 于 当前 上 日 好 而 言 的 。 在 命令 行 终端 上 ， 通 
过 cd 命令 进入 的 目录 就 是 当前 目录 ; 在 Java 中 ， 通 过 System.getProperty 
("user.dir") 可 以 得 到 运行 Java 程 序 的 当前 目录 。 相 对 路 径 不 以 根 目录 
开头 ， 比 如 在 Windows 上 ， 当 前 目录 为 D: Maoma， 相 对 路 径 为 
code\hello.java， 则 完整 路 径 为 D: \laoma\code\hello.java 。 


每 个 文件 除了 有 具体 内 容 ， 还 有 元 数据 信息 ， 如 文件 名 、 创 建 时 
间 、 修 改 时 间 、 文 件 大 小 等 。 文 件 还 有 一 个 是 否 隐 藏 的 性 质 。 在 Linux 
系统 中 ， 如 条 文件 名 以 .开头 ， 则 为 隐藏 文件 ， 在 Windows 系 统 中 ， 隐 
茂生 文件 的 一 个 属性 ， 可 以 进行 设置 。 


大 部 分 文件 系统 的 文件 和 目录 具有 访问 权限 的 概念 ， 对 所 有 者 、 
用 户 组 可 以 有 不 同 的 权限 ， 具 体 权限 包括 读 、 写 、 执 行 。 


文件 名 有 大 小 写 是 否 敏感 的 概念 。 在 Windows 系 统 中 ， 一 般 是 
小 写 不 敏感 的 ， 而 Linux 则 一 般 是 大 小 写 敏 感 的 。 也 就 是 说 ， 同 一 个 目 
录 下 ，abctxt 和 ABC.txt 在 Windows 中 被 视 为 同一 个 文件 ， 而 在 Linux 中 
则 被 视 为 不 同 的 文件 。 


操作 系统 中 有 一 个 临时 文件 的 概念 。 临 时 文件 位 于 一 个 特定 目 
录 ， 比 如 Windows 7 中 ， 临 时 文件 一 般 位 于 “C: \Users\ 用 户 名 
\AppData\Local\Temp”; Linux 系 统 中 ， 临 时 文件 位 于 /tmp。 操 作 系 统 会 
有 一 定 的 策略 自动 清理 不 用 的 临时 文件 。 临 时 文件 一 般 不 是 用 户 手 工 
创建 的 ， 而 是 应 用 程序 产生 的 ， 用 于 临时 目的 。 


5. 文 件 读 写 


文件 是 放 在 硬盘 上 的 ， 程 序 处 理 文件 需要 将 文件 读 和 内存， 修改 
后 ， 需 要 写 回 硬盘 。 操 作 系 统 提供 了 对 文件 读 写 的 基本 API， 不 同 操作 
系统 的 接口 和 实现 是 不 一 样 的 ， 不 过 ， 有 一 些 共 同 的 概念 。Java 封 装 了 
操作 系统 的 功能 ， 提 供 了 统一 的 API。 


一 个 基本 和 单 识 是 : 硬盘 的 访问 延 时 ， 相 比 内 存 ， 是 很 慢 的 。 操 作 
系统 和 硬盘 一 般 是 按 块 批量 传输 ， 而 不 是 按 字 了 ， 以 摊 销 延 时 开销 ， 
块 大 小 一 般 至 少 为 512 字 节 ， 即 使 应 用 程序 只 需要 文件 的 一 个 字 节 ， 操 
作 系 统 也 会 至 少将 一 个 块 读 进 来 。 一 般 而 言 ， 应 尽量 减少 接触 硬 到 ， 
接触 一 次 ， 台 一 次 多 做 一 些 事情 。 对 于 网 络 请 求 和 其 他 输入 输出 设 
备 ， 原 则 都 是 类 似 的 。 


男 一 个 基本 常识 是 ， 一 般 读 写 文件 需要 两 次 数据 复制 ， 比 如 读 文 
件 ， 需 要 先 从 硬盘 复制 到 操作 系统 内 核 ， 再 从 内 核 复制 到 应 用 程序 分 
配 的 内 存 中 。 操 作 系统 运行 所 在 的 环境 和 应 用 程序 是 不 一 样 的 ， 操 作 
系统 所 在 的 环境 是 内 核 态 ， 应 用 程序 是 用 户 态 ， 应 用 程序 调用 操作 系 
统 的 功能 ， 需 要 两 次 环境 的 切换 ， 爷 从 用 户 态 切 到 内 核 态 ， 再 从 内 核 
人 

才 o 


为 了 提升 文件 操作 的 效率 ， 应 用 程序 经 常 使 用 一 种 常见 的 策略 ， 
即使 用 缓冲 区 。 读 文件 时 ， 即 使 目前 只 需要 少量 内 容 ， 但 预知 还 会 接 


看 读 取 ， 束 一 次 读 取 比 较 多 的 内 容 ， 放 到 读 缓 冲 区 ， 下 次 读 取 时 ， 如 
果 缓 冲 区 有 ， 就 直接 从 缓冲 区 读 ， 减 少 访问 操作 系统 和 硬盘 。 写 文件 
时 ， 移 写 到 写 缓 冲 区 ， 写 缓冲 区 满 了 之 后 ， 再 一 次 性 调用 操作 系统 写 
到 硬盘 。 不 过 ， 需 要 注意 的 是 ， 在 写 结束 的 时 候 ， 要 记 住 将 缓冲 区 的 
剩余 内 容 同步 到 硬盘 。 操 作 系统 目 身 也 会 使 用 缓 钟 区， 不过， 应 用 程 
序 更 了 解读 写 模 式 ， 恰 当 使 用 往往 可 以 有 更 高 的 效率 。 


操作 系统 操作 文件 一 般 有 打开 和 关闭 的 概念 。 打 开 文 件 会 在 操作 
系统 内 核 建立 一 个 有 关 该 文件 的 内 存 结构 ， 这 个 结构 一 般 通 过 一 个 整 
数 索 引 来 引用 ， 这 个 索引 一 般 称 为 文件 描述 符 。 这 个 结构 是 请 耗 内 存 
的 ， 操 作 系统 能 同时 打开 的 文件 一 般 也 是 有 限 的 ， 在 不 用 文件 的 时 
候 ， 应 该 记 住 天 闭 文 件 。 天 闭 文 件 一 般 会 同步 缓冲 区 内 容 到 硬盘 ， 并 
释放 占据 的 内 存 结构 。 


操作 系统 一 般 文 持 一 种 称 为 内 存 映 射 文件 的 高 效 的 随机 读 写 大 文 
件 的 方法 ， 将 文件 直接 映射 到 内 存 ， 操 作 内 存 吏 是 操作 文件 。 在 内 存 
映射 文件 中 ， 只 有 访问 到 的 数据 才 会 被 实际 复制 到 内 存 ， 且 数据 只 会 
复制 一 次 ， 被 操作 系统 以 及 多 个 应 用 程序 共享 。 


13.1.2 ”Java 文件 概述 


在 Java 中 处 理 文 件 有 一 些 基 本 概念 和 类 ， 包 括 流 、 装 饰 器 设计 模 
式 、ReaderWriter、 随 机 读 写 文件 、EFile、NIO、 序 列 化 和 反 序 列 化 ， 
下 面 分 别 介绍 。 


1 . 流 


在 Java 中 〈 很 多 其 他 语言 也 类 似 ) ， 文 件 一 般 不 是 单独 处 理 的 ， 而 
是 视 为 输入 输出 (Input/Output，IO) 设备 的 一 种 。Java 使 用 基本 统一 
的 概念 处 理 所 有 的 IO， 包 括 键 盘 、 显 示 终 端 、 网 络 等 。 


这 个 统一 的 概念 是 流 ， 流 有 输入 流 和 输出 流 之 分 。 输 入 流 就 是 可 
以 从 中 获取 数据 ， 输 入 流 的 实际 提供 痢 可 以 羡 键 盘 、 文 件 、 网 络 等 ; 
输出 流 束 是 可 以 回 其 中 写 入 数据 ， 输 出 流 的 实际 目的 地 可 以 十 显 示 终 
端 、 文 件 、 网 络 等 。 


Java IO 的 基本 类 大 多 位 于 包 java.io 中 。 类 InputStream 表 示 输 入 流 ， 
OutputStream 表 示 输 出 流 ， 而 FileInputStream 表 示 文 件 输入 流 ， 
FileOutputStream 表 示 文 件 输出 流 。 


有 了 流 的 概念 ， 就 有 了 很 多 面向 流 的 代码 ， 比 如 对 流 做 加 密 、 压 
缩 、 计 算 信息 摘要 、 计 算 检 验 和 等 ， 这 些 代码 接受 的 参数 和 返回 结 
都 是 抽象 的 流 ， 它 们 构成 了 一 个 协作 体系 ， 这 类 似 于 之 前 介绍 的 接口 
概念 、 面 回 接 口 的 编程 ， 以 及 容器 类 协作 体系 。 一些 实际 上 不 是 IO 的 
数据 源 和 目的 地 也 转换 为 了 流 ， 以 方便 参与 这 种 协作 ， 比 如 字 市 数 
组 ， 也 包装 为 了 流 ByteArrayInputStream 和 ByteArrayOutputStream。 

2. 装 饥 需 设计 模式 

基本 的 流 按 字 节 读 写 ， 没 有 缓冲 区 ， 这 不 方便 使 用 。Java 解 决 这 个 
问题 的 方法 是 使 用 装饰 句 设 计 模 式 ， 引 入 了 很 多 装饰 类 ， 对 基本 的 流 
增加 功能 ， 以 方便 使 用 。 一 般 一 个 类 只 关注 一 个 方面 ， 实 际 使 用 时 ， 
经 常会 需要 多 个 装饰 类 。 

Java 中 有 很 多 装饰 类 ， 有 两 个 其 类 : 过 滤器 输入 流 
FilterInputStream 和 过 滤器 输出 流 FilterOutputStream。 过 小 类 似 于 目 来 
水 管道 ， 流 入 的 是 水 ， 流 出 的 也 是 水 ， 功 能 不 变 ， 或 者 只 是 增加 功 
能 。 它 有 很 多 子 类 ， 这 里 列举 一 些 : 


1) 对 流 起 缓冲 装饰 的 子 类 是 BufferedInputStream 和 
BufferedOutputStream ° 


2) 可 以 按 8 种 基本 类 型 和 字符 串 对 流 进行 读 写 的 子 类 是 
DataInputStream 和 DataOutput-Stream 。 


3) 可 以 对 流 进行 压缩 和 解压 缩 的 子 类 有 GZIPInputStream 、 
ZipInputStream、GZIPOutput-Stream 和 ZipOutputStream ° 


4) 可 以 将 基本 类 型 、 对 象 输出 为 其 字符 串 表 示 的 子 类 有 


PrintStream ° 
众多 的 装饰 类 使 得 整个 类 结构 变 得 比较 复杂 ， 人 完成 基本 的 操作 也 


0 其 优点 是 非常 灵活 ， 在 解决 东 些 问题 时 也 很 优 


3.Reader/Writer 

以 InputStream/OutputStream 为 基 类 的 流 基 本 都 是 以 二 进 制 形式 处 理 
数据 的 ， 不 能 够 方便 地 处 理 文本 文件 ， 没 有 编码 的 概念 ， 能 够 方便 地 
按 字 符 处 理 文 本 数据 的 基 类 是 Reader 和 Writer， 它 也 有 很 多 子 类 : 


1) 读 写 文件 的 子 类 是 FileReader 和 FileWriter 。 


2) 起 缓冲 装饰 的 子 类 是 BufferedReader 和 BufferedWriter 。 


3) 将 字符 数组 包装 为 Reader/Writer 的 子 类 是 CharArrayReader 和 
CharArrayWriter ° 


4) 将 字符 串 包装 为 Reader/Writer 的 子 类 是 StringReader 和 和 
StringWriter ° 


5) 将 InputStream/OutputStream 转 换 为 Reader/Writer 的 子 类 是 
InputStreamReader 和 OutputStreamWriter ° 


6) 将 基本 类 型 、 对 象 输出 为 其 字符 串 表 示 的 子 类 是 PrintWriter 。 
4. 随 机 读 写 文件 

大 部 分 情况 下 ， 使 用 流 或 Reader/Writer 读 写 文 件 内 容 ， 但 Java 提 供 
了 一 个 独立 的 可 以 随机 读 写 文件 的 类 RandomAccessFile， 适 用 于 大 小 已 
知 的 记录 组 成 的 文件 。 该 类 在 日 党 应 用 开发 中 用 得 比较 少 ， 但 在 一 些 
系统 程序 中 用 得 比较 多 。 
5.File 


上 面 介绍 的 都 是 操作 数据 本 号， 而 关于 文件 路 径 、 文 件 元 数据 、 
文件 目录 、 临 时 文件 、 访 问 权 限 管理 等 ，Java 使 用 File 这 个 类 来 表示 。 


6.NIO 


以 上 介绍 的 类 基本 都 位 于 包 java.io 下，Java 还 有 一 个 关于 IO 操 作 的 
包 java.nio，nio 表 示 New IO， 这 个 包 下 同样 包含 大 量 的 类 。 


NIO 代 表 一 种 不 同 的 看 待 IO 的 方式 ， 它 有 缓冲 区 和 通道 的 概念 
利用 缓冲 区 和 通道 往往 可 以 达成 和 流 类 似 的 目的 ， 不 过 ， 它 们 更 接近 
操作 系统 的 概念 ， 某 些 操作 的 性 能 也 更 高 。 比 如 ， 复 制 文 件 到 网 络 ， 
通道 可 以 利用 操作 系统 和 硬件 提供 的 DMA 机 制 (Direct Memory 
Access， 直 接 内 存 存 取 ) ， 不 用 CPU 和 应 用 程序 参与 ， 直 接 将 数据 从 硬 
盘 复 制 到 网 卡 。 


除了 看 待 方式 不 同 ，NIO 还 文 持 一 些 比较 底层 的 功能 ， 如 内 存 映 射 
文件 、 文 件 加 锁 、 目 定义 文件 系统 、 非 阻塞 式 IO0、 有 异步 IO 等 。 


不 过 ， 这 些 功能 要 么 是 比较 底层 ， 普 通 应 用 程序 用 到 得 比较 少 ， 
i 


7. 序 列 化 和 反 序 列 化 


简单 来 说 ， 序 列 化 殊 是 将 内 存 中 的 Java 对 象 持久 保存 到 一 个 流 中 ， 
反 序列 化 束 是 从 流 中 恢复 Java 对 象 到 内 存 。 序 列 化 和 反 序 列 化 主要 有 两 
2 
对 象 。 


Java 主 要 通过 接口 Serializable 和 类 
ObjectInputStream/ObjectOutputStream 提 供 对 序列 化 的 支持 ， 基 本 的 使 
用 是 比较 简单 的 ， 但 也 有 一 些 复杂 的 地 方 。 不 过 ，Java 的 默认 序列 化 有 
一 些 人 缺点， 比如， 序列 化 后 的 形式 比较 大 、 浪 费 空间 ， 序 列 化 / 反 序列 
化 的 性 能 也 比较 低 ， 更 重要 的 问题 是 ， 它 是 Java 特 有 的 技术 ， 不 能 与 其 


他 语言 交互 。 


XML 是 前 几 年 最 为 流行 的 描述 结构 性 数据 的 语言 和 格式 ，Java 对 
象 也 可 以 序列 化 为 XML 格式 。XML 容易 阅 读 和 编辑 ， 且 可 以 方便 地 与 
其 他 语言 进行 交互 。XML 强 调 格式 化 但 比较 “笨重 ”，JSON 是 近 几 年 来 
逐渐 流行 的 轻 量 级 的 数据 交换 格式 ， 在 很 多 场合 奉 代 了 XML ， 也 非常 
EL 
进行 交互 。 


XML 和 JSON 都 是 文本 格式 ， 人 容易 阅读 ， 但 占用 的 空间 相对 大 一 
些 ， 在 只 用 于 网 络 远 程 调 用 的 情况 下 ， 有 很 多 流行 的 、 跨 语言 的 、 精 


简 且 高 效 的 对 象 序列 化 机 制 ， 如 ProtoBuf、Thrift、MessagePack 等 。 其 
中 ，MessagePack 是 二 进 制 形式 的 JSON， 更 小 更 快 。 


文件 看 起 来 写 一 件 非常 简单 的 事情 ， 但 实际 却 没有 那么 和 测 单 ，Java 
的 设计 也 不 是 太 完美 ， 包 含 了 大 量 的 类 ， 这 使 得 对 于 文件 的 理解 变 得 
困难 。 为 便于 理解 ， 我 们 将 采用 以 下 思路 在 接 下 来 的 章 下 中 进行 探 


讨 


首先 ， 我 们 介绍 如 何 处 理 二 进 制 文件 ， 或 者 将 所 有 文件 看 作 二 进 
制 ， 介 绍 如 何 操 作 ， 对 于 常见 操作 ， 我 们 会 封 狐 ， 拓 供 一 些 简 单 易 用 
的 方法 。 下 一 步 ， 我 们 介绍 如 何 处 理 文本 文件 ， 我 们 会 考虑 编码 、 按 
行 处 理 等， 同样 ， 对 于 利 见 操作 ， 我 们 会 封 效 ， 提 供 简单 易 用 的 方 
法 。 接 下 来 ， 我 们 介绍 文件 本 号 和 目 永 操作 File 类 ， 我 们 也 会 封 猴 币 见 
操作 。 以 上 这 些 内 容 是 文件 处 理 的 基本 技术 ， 我 们 会 在 本 章 进行 讨 


论 。 


在 日 常 编程 中 ， 我 们 经 常会 需要 处 理 一 些 具 体 类 型 的 文件 ， 如 属 
性 文件 、CSV 文 件 、Excel 文 件 、HTML 文 件 和 压缩 文件 ， 直 接 使 用 字 
下 流 /字符 流 来 处 理 一 般 是 很 不 方便 的 ， 往 往 有 一 些 更 为 高 层 的 APT， 
大 于 这 些 ; 我 们 下 前 介绍 此 外 ; 下 章 还 会 介绍 比较 底层 的 对 文件 的 
操作 RandomAccessFile 类 、 内 存 映 冉 文 件 ， 以 及 序列 化 。 文 件 看 上 去 应 
0 但 实际 却 包含 很 多 内 容 ， 让 我 们 耐 住 性 子 ， 下 一 让， 先 从 
三 进 制 开始 


13.2 ”二进制 文件 和 字 太 尝 


本 节 介 绍 在 Java 中 如 何以 二 进 制 子 节 的 方式 来 处 理 文 件 ， 前 面 我 
们 提 到 Java 中 有 流 的 概念 ， 以 二 进 制 方式 读 写 的 主要 流 有 : 


:InputStream/OutputStream: 这 是 基 类 ， 它 们 是 抽象 类 。 


:FileInputStream/FileOutputStream: 输入 源 和 输出 目标 是 文件 的 
流 。 


.ByteArrayInputStream/ByteArrayOutputStream: 输入 源 和 输出 目标 
是 字 节 数组 的 流 。 
i A 


:DataInputStream/DataOutputStream: 装饰 类 ， 按 基本 类 型 和 字符 
串 而 非 只 是 字 他 读 写 流 。 


:BufferedInputStream/BufferedOutputStream: 浅 饰 类 ， 对 输入 输出 
流 提 供 缓 冲 功 能 。 


下 面 ， 我 们 殊 来 介绍 这 些 类 的 功能 、 用 法 、 原 理 和 使 用 场景 ， 最 
后 总 结 一 些 简单 的 实用 方法 。 


13.2.1 InputStream/OutputStream 


我 们 分 别 看 下 InputStream 和 OutputStream。 
1.InputStream 
(1) InputStream 的 基本 方法 
InputStream 是 抽象 类 ， 主 要 方法 是 : 


public abstract int read() throws IOException; 


read 方 法 从 流 中 读 取 下 一 个 字 季 ， 返 回 类 型 为 int， 但 取 值 为 0 一 
255， 当 读 到 流 结尾 的 时 候 ， 返 回 值 为 -1， 如 果 流 中 没有 数据 ，read 方 
法 会 阻塞 直到 数据 到 来 、 流 关闭 或 异种 出 现 。 腊 第 出 现时 ，read 方 法 
抛 出 异常 ， 类 型 为 JOException， 这 是 一 个 受 检 腊 常 ， 调 用 者 必须 进行 
处 理 。read 是 一 个 抽象 方法 ， 具 体 子 类 必须 实现 ，FileInputStream 会 调 
用 本 地 方法 。 所 谓 本 地 方法 ， 一 般 不 是 用 Java 写 的 ， 大 多 使 用 C 语 言 实 
现 ， 具 体 实 现 往 往 与 虚拟 机 和 操作 系统 有 关 。 


InputStream 下 有 如 下 方法 ， 可 以 一 次 读 取 多 个 字 廊 : 


public int read(byte b[]) throws IOException 


读 入 的 字 万 放 入 参数 数组 b 中 ， 第 一 个 字 节 存 入 b[0]， 第 二 个 存 入 
b[1]， 以 此 类 推 ， 一 次 最 多 读 入 的 字 太 个 数 为 数组 b 的 长 度 ， 但 实际 读 
入 的 个 数 可 能 小 于 数组 长 度 ， 返 回 值 为 实际 读 入 的 字 广 个 数 。 如 果 刚 
开始 读 取 时 已 到 流 结尾 ， 则 返回 -1; 否则 ， 只 要 数组 长 度 大 于 0， 该 方 
法 都 会 尽力 至 少 读 取 一 个 字 方 ， 如 果 流 中 一 个 字 方 都 没有 ， 它 会 阻 
塞 ， 异 常 出 现时 也 是 抛 出 IOException 。 该 方法 不 是 抽象 方法 ， 
InputStream 有 一 个 默认 实现 ， 主 要 就 是 循环 调用 读 一 个 字 和 的 read 方 
法 ， 但 子 类 如 FileInputStream 往 往 会 提供 更 为 高 效 的 实现 。 


批量 读 取 还 有 一 个 更 为 通用 的 重 载 方法 : 


public int read(byte b[], int off, int len) throws IOException 


读 入 的 第 一 个 字 节 放 入 b[of]， 最 多 读 取 len 个 字 节 ，read (byte 
b[]) 就 是 调用 了 该 方法 : 


public int read(byte b[]) throws IOException { 
return read(b, 0, b.length); 
} 


流 读 取 结束 后 ， 应 该 关闭 ， 以 释放 相关 资源 ， 关 闭 方法 为 : 


public long skip(long n) throws IOException 
public int available() throws IOException 
public synchronized void mark(int readlimit) 


public boolean markSupported () 
public synchronized void reset() throws IOEXception 


不 管 read 方 法 是 否 抛 出 了 有 异常 ， 都 应 该 调用 close 方 法 ， 所 以 close 
方法 通常 应 该 放 在 finally 语 句 内 。close 方 法 目 己 可 能 也 会 抛 出 
IOException， 但 通常 可 以 捕获 并 名 上 略 。 


(2) InputStream 的 高 级 方法 
InputStream 还 定义 了 如 下 方法 ; 


skip 跳 过 输入 流 中 mn 个 字 下 ， 因 为 输入 流 中 剩余 的 字 节 个 数 可 能 不 
到 n， 所 以 返回 值 为 实际 略 过 的 字 节 个 数 。InputStream 的 默认 实现 就 是 
尽力 读 取 n 个 字 节 并 扔 掉 ， 子 类 往往 会 提供 更 为 高 效 的 实现 ， 
FileInputStream 会 调用 本 地 方法 。 在 处 理 数据 时 ， 对 于 不 感 兴趣 的 部 
分 ，skip 往 往 比 读 取 然 后 扔 掉 的 效率 要 高 。 


available 返 回 下 一 次 不 需要 阻塞 整 能 读 取 到 的 大 概 字 市 个 数 。 
InputStream 的 默认 实现 是 返回 9， 子 类 会 根据 具体 情况 返回 适当 的 值 ， 
FileInputStream 会 调用 本 地 方法 。 在 文件 读 写 中 ， 这 个 方法 一 般 没 什么 
用 ， 但 在 从 网 络 读 取 数 据 时 ， 可 以 根据 该 方法 的 返回 值 在 网 络 有 足够 
数据 时 才 读 ， 以 避免 阻塞 。 


一 般 的 流 读 取 都 是 一 次 性 的 ， 且 只 能 往 前 读 ， 不 能 往 后 读 ， 但 有 
时 可 能 希望 能 够 先 看 一 下 后 面 的 内 容 ， 根 据 情 况 再 重新 读 取 。 比 如 ， 
处 理 一 个 未 知 的 二 进 制 文件 ， 我 们 不 确定 它 的 类 型 ， 但 可 能 可 以 通过 
流 的 前 几 十 个 字 厄 判断 出 来 ， 判 读 出 来 后 ， 再 重 置 到 流 开 头 ， 交 给 相 
应 类 型 的 代码 进行 处 理 。 

InputStream 定 义 了 三 个 方法 : mark、reset、markSupported， 用 于 
支持 从 读 过 的 流 中 重复 读 取 。 怎 么 重复 读 取 呢 ? 先 使 用 mark () 方法 
将 当前 位 置 标记 下 来， 在 读 取 了 一 些 字 节 ， 希望 重新 从 标记 位 置 读 
时 ， 调 用 reset 方 法 。 能 够 重复 读 取 不 代表 能 够 回 到 任意 的 标记 位 置 ， 
mark 方 法 有 一 个 参数 readLimit， 表 示 在 设置 了 标记 后 ， 能 够 继续 往 后 
读 的 最 多 字 节 数 ， 如 果 超 过 了 ， 标 记 会 无 效 。 为 什么 会 这 样 呢 ?” 因 为 
之 所 以 能 够 重读 ， 是 因为 流 能 够 将 从 标记 位 置 开 始 的 字 节 保存 起 来 ， 
而 保存 消耗 的 内 存 不 能 无 限 大 ， 流 只 保证 不 会 小 于 readLimit 。 


不 是 所 有 流 都 支持 mark、reset 方 法 ， 是 否 支 持 可 以 通过 
markSupported 的 返回 值 进行 判断 。InpuStream 的 默认 实现 是 不 支持 ， 
FileInputStream 也 不 直接 文 持 ， 但 BufferedInput-Stream 和 
ByteArrayInputStream 可 以 支持 。 
2.0utputStream 


OutputStream 的 基本 方法 是 : 


public abstract void write(int b) throws IOException; 


癌 流 中 写 入 一 个 字 节 ， 参 数 类 型 虽然 是 int， 但 其 实 只 会 用 到 最 低 
的 8 位 。 这 个 方法 是 抽象 方法 ， 具 体 子 类 必须 实现 ，FileInputStream 会 
调用 本 地 方法 。 


OutputStream 还 有 两 个 批量 写 入 的 方法 : 


public void write(byte b[]) throws IOException 
public void write(byte b[], int off, int len) throws IOException 


在 第 二 个 方法 中 ， 第 一 个 写 入 的 字 节 是 b[off]， 写 入 个 数 为 len， 最 
后 一 个 是 b[off+len-1]， 第 一 个 方法 等 同 于 调用 write (b，0， 
b.length) ; 。OutputStream 的 默认 实现 是 循环 调用 单字 廊 的 write () 
方法 ， 子 类 往往 有 更 为 高 效 的 实现 ，FileOutpuStream 会 调用 对 应 的 批 
量 写本 地 方法 。 


OutputStream 还 有 两 个 方法 : 


public void flush() throws IOException 
public void close() throws IOException 


flush 方 法 将 缓冲 而 未 实际 写 的 数据 进行 实际 写 和 入， 比如， 在 
BufferedOutputStream 中 ， 调 用 flush 方 法 会 将 其 绥 冲 区 的 内 容 写 到 其 装 
饥 的 流 中 ， 并 调用 该 流 的 flush 方 法 。 基 类 OutputStream 没 有 绥 促 ， 
flush 方 法 代码 为 空 。 


需要 说 明 的 是 文件 输出 流 FileOutputStream， 你 可 能 会 认为 ， 调 用 
flush 方 法 会 强制 确保 数据 保存 到 硬盘 上 ， 但 实际 上 不 是 这 样 ， 
FileOutputStream 没 有 缓冲 ， 没 有 重 写 flush 方 法 ， 调 用 flush 方 法 没有 任 
何 效 果 ， 数 据 只 是 传递 给 了 操作 系统 ， 但 操作 系统 什么 时 候 保 存 到 硬 
盘 上 ， 这 是 不 一 定 的 。 要 确保 数据 保存 到 了 人 硬盘 上 ， 可 以 调用 
FileOutputStream 中 的 特有 方法 ， 具 体 待 会 介绍 。 


close 方 法 一 般 会 首先 调用 flush 方 法 ， 人 然后 再 释放 流 占 用 的 系统 资 
源 。 同 InputStream 一 样 ，close 方 法 一 般 应 该 放 在 finally 语 句 内 。 


13.2.2 FileInputStream/FileOutputStream 


FileInputStream 和 FileOutputStream 的 输入 源 和 输出 目标 是 文件 ， 
我 们 分 别 介绍 。 


1.FileOutputStream 


FileOutputStream 有 多 个 构造 方法 ， 其 中 两 个 如 下 所 示 : 


public FileOutputStream(File file, boolean append) 
throws FileNotFoundException 
public FileoutputStream(String name) throws FileNotFoundException 


File 类 型 的 参数 fle 和 字符 串 的 类 型 的 参数 name 都 表示 文件 路 径 ， 
路 径 可 以 是 绝对 路 径 ， 也 可 以 是 相对 路 径 ， 如 有 果 文 件 已 存在 ，append 
参数 指定 是 人 退 加 还 是 履 盖 ，true 表 示 追 加 ，false 表 示 履 盖 ， 第 二 个 构造 
方法 没有 append 参 数 ， 表 示 敌 盖 。new 一 个 FileOutputStream 对 象 会 实 
际 打 开 文 件 ， 操 作 系 统 会 分 配 相关 资源 。 如 果 当 前 用 户 没有 写 权 限 ， 
会 抛 出 异常 SecurityException， 它 是 一 种 RuntimeException。 如 果 指 定 
的 文件 是 一 个 已 存在 的 目录 ， 或 者 由 于 其 他 原因 不 能 打开 文件 ， 会 抛 
出 异常 FileNotFoundException， 它 是 IJOException 的 一 个 子 类 。 


我 们 看 一 段 徐 单 的 代码 ， 将 字符 串 "hello，123， 老 马 " 写 到 文件 
hello.txt 中 : 


OutputStream output = new FileOutputStream("hello.txt"); 
try{ 


String data = "hello，123， 老 马 "， 
byte[] bytes = data.getBytes(Charset.forName("UTF-8")); 
output .write(bytes); 
}finally{ 
output .close( ); 


} 


OutputStream 只 能 以 byte 或 byte 数 组 写 文 件 ， 为 了 写字 符 串 ， 我 们 
调用 String 的 get-Bytes 方 法 得 到 它 的 UTF-8 编 码 的 字 节 数组 ， 再 调用 
write () 方法 ， 写 的 过 程 放 在 try 语 句 内 ， 在 finally 语 句 中 调用 close 方 
法 。 


FileOutputStream 下 有 两 个 额外 的 方法 : 


public FileChannel getChannel() 
public final FileDescriptor getFD() 


FileChannel 定 义 在 java.nio 中 ， 表 示 文 件 通道 概念 。 我 们 不 会 深入 
介绍 通道 ， 但 内 存 映射 文件 方法 定义 在 FileChannel 中 ， 我 们 会 在 下 章 
介绍 。FileDescriptor 表 示 文 件 描述 符 ， 它 与 操作 系统 的 一 些 文件 内 存 
结构 相连 ， 在 大 部 分 情况 下 ， 我 们 不 会 用 到 它 ， 不 过 它 有 一 个 方法 


SYyNnC: 


public native void sync() throws SyncFailedException; 


这 是 一 个 本 地 方法 ， 它 会 确 你 将 操作 系统 缓冲 的 数据 写 到 硬盘 
上 。 注 意 与 Output-Stream 的 flush 方 法 相 区 别 ，flush 方 法 只 能 将 应 用 程 
序 绥 冲 的 数据 写 到 操作 系统 ，sync 方 法 则 确保 数据 写 到 硬盘 ， 不 过 一 
般 情 况 下 ， 我 们 并 不 需要 手工 调用 它 ， 只 要 操作 系统 和 硬件 设备 没 问 
题 ， 数 据 迟 早 会 写 入 。 在 一 定 特定 情况 下 ， 一 定 需 要 确保 数据 写 入 便 
盘 ， 则 可 以 调用 该 方法 。 


2.FileInputStream 


FileInputStream 的 主要 构造 方法 有 : 


public FileInputStream(String name) throws FileNotFoundException 
public FileInputStream(File file) throws FileNotFoundException 


参数 与 FileOutputStream 类 似 ， 可 以 是 文件 路 径 或 File 对 象 ， 但 必 
须 是 一 个 已 存在 的 文件 ， 不 能 是 目录 。new 一 个 FilemputStream 对 和 象 也 
会 实际 打开 文件 ， 操 作 系 统 会 分 配 相 关 资 源 ， 如 果 文 件 不 存在 ， 会 抛 
出 异常 FileNotFoundException， 如 果 当 前 用 户 没有 读 的 权限 ， 会 抛 出 
异常 SecurityException。 我 们 看 一 段 简 单 的 代码 ， 将 上 面 写 入 的 文 
件 "hello.txt" 读 到 内 存 并 输出 : 


InputStream input = new FileInputStream("hello.txt"); 
try{ 
byte[] buf = new byte[1024]; 
int bytesRead = input.read(buf ) ， 
String data = new String(buf, 0, bytesRead, "UTF-8"); 
System.out.println(data); 
}finally{ 
input.close(); 


读 入 到 的 是 byte 数 组 ， 我 们 使 用 String 的 带 编 码 参 数 的 构造 方法 将 
其 转换 为 了 String。 这 上段 代码 假定 一 次 read 调 用 就读 到 了 所 有 内 容 ， 且 
假定 字 市 长 度 不 超过 1024。 为 了 确保 读 到 所 有 内 容 ， 可 以 逐个 字 市 读 
取 直 到 文件 结束 : 


int b = -1; 

int bytesRead = 0; 

while( (b=input.read())!=-1){ 
buf[bytesRead++] = (byte)b， 


在 没有 绥 冲 的 情况 下 逐个 字 市 读 取 性 能 很 低 ， 可 以 使 用 批量 读 入 
且 确 你 读 到 结尾 ， 如 下 所 示 : 


byte[] buf = new byte[1024]; 

int off = 0; 

int bytesRead = 0; 

while( (bytesRead=input.read(buf, off, 1024-0off ))!=-1){ 
off += bytesRead; 


} 
String data = new String(buf, 0, off, "UTF-8"); 


不 过 ， 这 还 是 假定 文件 内 容 长 度 不 超过 一 个 固定 的 大 小 1024。 如 
林 不 确定 文件 内 容 的 长 度 ， 但 不 希望 一 次 性 分 配 过 大 的 byte 数 组 ， 又 


硕 望 将 文件 内 容 全 部 读 入 ， 怎 么 做 呢 ? 可 以 借助 
ByteArrayOutputStream， 我 们 下 面 进行 介绍 。 


13.2.3 ByteArrayInputStream/ByteArrayOutputStream 


它们 的 输入 源 和 输出 目标 是 子 节 数组 ， 我 们 分 别 介绍 。 
1.ByteArrayOutputStream 


ByteArrayOutputStream 的 输出 目标 是 一 个 byte 数 组 ， 这 个 数组 的 
长 度 是 根据 数据 内 容 动态 扩展 的 ， 它 有 两 个 构造 方法 : 


public ByteArrayoutputStream( ) 
public ByteArrayOutputStream(int size) 


第 二 个 构造 方法 中 的 Size 指定 的 吏 是 初始 的 数组 大 小 ， 如 果 没 有 
指定 ， 则 长 度 为 32。 在 调用 write 方法 的 过 程 中 ， 如 有 果 数 组 大 小 不 够 ， 
会 进行 扩展 ， 扩 展 策 略 同样 是 指数 扩展 ， 每 次 至 少 增加 一 倍 。 


ByteArrayOutputStream 有 如 下 方法 ， 可 以 方便 地 将 数据 转换 为 字 
广 数 组 或 字符 串 : 


public synchronized byte[] toByteArray() 
public synchronized String toString() 
public synchronized String toString(String charsetName) 


toString () 方法 使 用 系统 默认 编码 。 
ByteArrayOutputStream 中 的 数据 也 可 以 方便 地 写 到 另 一 个 


OutputStream: 


public synchronized void writeTo(OutputStream out) throws IOException 


ByteArrayOutputStream 还 有 如 下 额外 方法 : 


public synchronized int size() 
public synchronized void reset() 


Size 方法 返回 当前 写 入 的 字 贡 个 数 。reset 方 法 重 置 字 和 个 数 为 0， 
reset 后 ， 可 以 重用 已 分 配 的 数组 。 


使 用 ByteArrayOutputStream， 我 们 可 以 改进 前 面 的 读 文 件 代 码 ， 
确 你 将 所 有 文件 内 容 读 入 : 


InputStream input = new FileInputStream("hello.txt"); 


try{ 
ByteArrayOutputStream output = new ByteArrayOutputStream(); 


byte[] buf = new byte[1024]; 

Int bytesRead = 0; 

while( (bytesRead=input.read(buf))!=-1){ 
output .write(buf, 90, bytesRead); 


} 
String data = output.toString("UTF-8"); 
System.out.println(data); 


}finally{ 
input.close(); 
} 


读 入 的 数据 先 写 入 ByteArrayOutputStream 中 ， 读 完 后 ， 再 调用 其 
toString 方 法 获取 完整 数据 。 


2.ByteArrayInputStream 


ByteArrayInputStream 将 byte 数 组 包装 为 一 个 输入 流 ， 是 一 种 适 配 
名 模式 ， 它 的 构造 方法 有 : 


public ByteArrayInputStream(byte buf[]) 
public ByteArrayInputStream(byte buf[], int offset, int length) 


第 二 个 构造 方法 以 buf 中 offset 开 始 的 length 个 字 太 为 背后 的 数据 。 
ByteArrayInput-Stream 的 所 有 数据 都 在 内 存 ， 文 持 mark/reset 重 复读 
取 。 


为 什么 要 将 byte 数 组 转换 为 InputStream 呢 ? 这 与 容 吉 类 中 要 将 数 
组 、 单 个 元 素 转 换 为 容 右 接口 的 原因 是 类 似 的 ， 有 很 多 代码 是 以 


InputStream/OutputSteam 为 参数 构建 的 ， 它 们 构成 了 一 个 协作 体系 ， 将 
byte 数 组 转换 为 nputStream 可 以 方便 地 参与 这 种 体系 ， 复 用 代码 。 


13.2.4 DatalnputStream/DataOutputStream 


上 面 介绍 的 类 都 只 能 以 字 节 为 单位 读 写 ， 如 何以 其 他 类 型 读 写 
呢 ? 比如 int、double。 可 以 使 用 DataInputStream/DataOutputStream， 它 
们 都 是 装饰 类 。 


1.DataOutputStream 


DataOutputStream 是 装饰 类 基 类 FilterOutputStream 的 子 类 ， 
FilterOutputStream 是 Output-Stream 的 子 类 ， 它 的 构造 方法 是 : 


它 接受 一 个 已 有 的 OutputStreaam， 基 本 上 将 所 有 操作 都 代理 给 了 
它 。DataOutputStream 实 现 了 DataOutput 接 口 ， 可 以 以 各 种 基本 类 型 和 
字符 串 写 入 数据 ， 部 分 方法 如 下 


void writeBoolean(boolean v) throws IOException; 
void writeInt(int v) throws IOException; 
void writeUTF(String s) throws IOException; 


在 写 入 时 ，DataOutputStream 会 将 这 些 类 型 的 数据 转换 为 其 对 应 的 
二 进 制 字 节 ， 比 如 : 


1) writeBoolean: 写 入 一 个 字 节 ， 如 果 值 为 tue， 则 写 入 1， 和 否则 
0 O 


2) writeInt: 写 入 4 个 字 节 ， 最 高 位 字 节 先 写 入 ， 最 低位 最 后 写 
入 o 


3) writeUTF: 将 字符 串 的 UTF-8 编 码 字 节 写 入 ， 这 个 编码 格式 与 
标准 的 UTF-8 编 码 略 有 不 同 ， 不 过 ， 我 们 不 用 关心 这 个 细节 。 


与 FilterOutputStream 一 样 ，DataOutputStream 的 构造 方法 也 是 接受 
一 个 已 有 的 Output-Stream: 


public Datao0utputStream(OutputStream out) 


我 们 来 看 一 个 例子 ， 保 存 一 个 学 生 列表 到 文件 中 ， 学 生 类 的 定义 


可 


class Student { 
String name; 
int age; 
double score; 
// 省 略 构 造 方法 和 getter/setter 方 法 


} 


学 生 列表 内 容 为 : 


List<Student> students = Arrays.asList(new Student[]{ 
new Student(" 张 三 "，18，80.9d)，new Student(" 李 四 


', 17, 67.5d) 
}); 


将 该 列表 内 容 写 到 文件 students.dat 中 的 代码 可 以 为 : 


public static void writeStudents(List<Student> students) throws IOException{ 
Data0utputStream output = new Data0utputStream( 
new FileOutputStream("students.dat")); 
try{ 
output .writeInt(students. size()); 
for(Student s : students){ 
output .writeUTF(s.getName()); 
output .writeInt(s.getAge()); 
output .writeDouble(s.getSscore()); 


} 
}finally{ 
output .close( ); 


我 们 先 写 了 列表 的 长 度 ， 然 后 针对 每 个 学 生 、 每 个 字段 ， 根 据 其 
类 型 调用 了 相应 的 write 方法 。 


2.DataInputStream 


DataInputStream 是 装饰 类 基 类 FilterInputStream 的 子 类 ， 
FilterInputStream 是 mput-Stream 的 子 类 。DataImnputStream 实 现 了 


口 ， 可 以 以 各 种 基本 类 型 和 字符 串 读 取 数 据 ， 部 分 方法 


boolean readBoolean() throws IOException; 
int readInt() throws IOException; 
String readUTF() throws IOException,; 


在 读 取 时 ，DataInputStream 会 先 按 字 太 读 进 来 ， 然 后 转换 为 对 应 
的 类 型 。 


DataInputStream 的 构造 方法 接受 一 个 mputStream: 


public DataInputStream(InputStream in) 


还 是 以 上 面 的 学 生 列表 为 例 ， 我 们 来 看 怎么 从 文件 中 读 进 来 : 


public static List<Student> readStudents() throws IOException{ 
DataInputStream input = new DataInputStream( 
new FileInputStream("students.dat")); 
try{ 
int size = input.readInt(); 
List<Student> students = new ArrayList<Student>(size); 
for(int i=0; i<size; I++){ 
Student s = new Student(); 
s.setName(input.readUTF()); 
s.setAge(input,.readIint()); 
s.setSscore(input.readDouble()); 
students.add(s); 


return students; 
}finally{ 
input.close(); 
} 


} 


读 基本 是 写 的 逆 过 程 ， 代 码 比 较 人 简单 ， 就 不 痪 述 了 。 使 用 
DataInputStream/DataOutput-Stream 读 写 对 象 ， 非 常 灵 活 ， 但 比较 碾 
烦 ， 所 以 Java 提 供 了 序列 化 机 制 ， 我 们 在 下 章 介绍 。 


13.2.5 BufferedInputStream/BufferedOutputStream 


FileInputStream/FileOutputStream 是 没有 缓冲 的 ， 按 单个 字 币 读 写 
时 性 能 比较 低 ， 虽 然 可 以 按 字 市 数组 读 取 以 提高 性 能 ， 但 有 时 必须 要 
按 字 市 读 写 ， 怎 么 解决 这 个 问题 呢 ? 方法 是 将 文件 流 包 装 到 绥 冲 流 
中 。BufferedInputStream 内 部 有 个 字 节 数组 作为 缓冲 区 ， 读 取 时 ， 先 从 
这 个 缓冲 区 读 ， 缓冲 区 读 完 了 再 调用 包装 的 流 读 ， 它 的 构造 方法 有 两 
[~: 


public BufferedInputStream(InputStream in) 
public BufferedInputStream(InputStream in, int size) 


size 表 示 绥 冲 区 大 小 ， 如 果 没 有 ， 默 认 值 为 8192。 除 了 提高 性 
能 ，BufferedInputStream 也 文 持 markreset， 可 以 重复 读 取 。 与 
BufferedInputStream 类 似 ，BufferedOutputStream 的 构造 方法 也 有 两 
个 ， 默 认 的 缓冲 区 大 小 也 是 8192， 它 的 flush 方 法 会 将 缓冲 区 的 内 容 写 
到 包 效 的 流 中 。 


在 使 用 FileInputStream/FileOutputStream 有 时 ， 应 该 几乎 总 是 在 它 的 
外 面包 上 对 应 的 缓冲 类 ， 如 下 所 示 : 


InputStream input = new BufferedInputStream( 
new FileInputStream("hello.txt")); 
OutputStream output = new BufferedoutputStream( 
new FileOutputStream("hello.txt")); 


再 比如 : 


Data0utputStream output = new Data0utputStream( 

new BufferedoutputStream(new FileOutputStream("students.dat"))); 
DataInputStream input = new DataInputStream( 

new BufferedInputStream(new FileInputStream("Sstudents ,dat") ) ); 


13.26 实用 方法 


可 以 看 出 ， 即 使 只 是 按 二 进 制 字 和 读 写 流 ，Java 也 包括 了 很 多 的 
类 ， 虽 然 很 灵活 ， 但 对 于 一 些 简 单 的 需求 ， 却 需要 写 很 多 代码 “实际 
开发 中 ， 经 常 需要 将 一 些 常用 功能 进行 封装 ， 提 供 更 为 简单 的 接口 。 


下 面 我 们 提供 一 些 实用 方法 ， 以 供 参 考 ， 这 些 代 码 都 比较 简单 易 收 ， 
我 们 就 不 解释 了 。 


复制 输入 流 的 内 容 到 输出 流 ， 代 码 为 : 


public static void copy(InputStream input, 
OutputStream output) throws IOException{ 
byte[] buf = new byte[4096]; 
Int bytesRead = 0， 
while((bytesRead = input.read(buf))!=-1){ 
output.write(buf, 0, bytesRead); 
} 


实际 上 ， 在 Java 9 中 ，InputStream 类 增加 了 一 个 方法 transferTo， 
可 以 实现 相同 功能 ， 实 现 是 类 似 的 ， 具 体 代码 为 : 


public long transferTo(OutputStream out) throws IOException { 
Objects.requireNonNull(out, "out"); 
long transferred = 0; 
byte[] buffer = new byte[DEFAULT_BUFFER_SIZE]; //buf 大 小 是 8192 
int read; 
while((read = this.read(buffer, 0, DEFAULT_BUFFER_ SIZE)) >= 0) { 
out.write(buffer, 0, read); 
transferred += read; 


return transferred ' 


将 文件 读 入 子 市 数组 ， 这 个 方法 调用 了 上 面 的 复制 方法 ， 具 体 代 


public static byte[] readFileToByteArray(String fileName) throws IOException{ 
InputStream input = new FilJleInputStream(fileName); 
ByteArrayOutputStream output = new ByteArrayOutputStream(); 
try{ 
copy(input, output); 
return output.toByteArray(); 
}finally{ 
input.close(); 


将 子 市 数组 写 到 文件 ， 代 码 为 : 


public static void writeByteArrayToFile(String fileName, 

byte[] data) throws IOException{ 

OutputStream output = new FileoutputStream(fileName ) ， 

try{ 
output .write(data); 

}finally{ 
output.close( ); 

} 


} 


Apache 有 一 个 类 库 Commons IO， 里 面 提供 了 很 多 人 简单 易 用 的 方 
法 ， 实 际 开 发 中 ， 可 以 考虑 使 用 。 


1 才 


本 节 介 绍 了 如 何在 Java 中 以 二 进 制 字 节 的 方式 读 写 文件 ， 介 绍 了 
主要 的 流 。 


1) InputStream/OutputStream: 是 抽象 基 类 ， 有 很 多 面向 流 的 代 
码 ， 以 它们 为 参数 ， 比 如 本 市 介绍 的 copy 方 法 。 


2) FileInputStream/FileOutputStream: 流 的 源 和 目的 地 是 文件 。 


3) Pole Tray pt mn yie nay Ontput tr oa 源 和 目的 地 是 
i 作为 输入 相当 于 适配器 ， 作 为 输出 封装 了 动态 数组 ， 便 于 


4) DataInputStream/DataOutputStream: 装饰 类 ， 按 基本 类 型 和 字 
符 串 读 写 流 。 


5) BufferedInputStream/BufferedOutputStream: 装饰 类 ， 提 供 组 
中，FileInputStream/FileOutputStream 一 般 总 是 应 该 用 该 类 浅 饰 。 


最 后 ， 我 们 提供 了 一 些 实 用 方法 ， 以 方便 常见 的 操作 ， 在 实际 开 
发 中 ， 可 以 考虑 使 用 专门 的 类 库 ， 如 Apache Commons IO 
(http://commons.apache.org/proper/commons-io/ ) 。 本 节 完 整 的 代码 
在 github 上 ， 地 址 为 https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.file.c57 下 。 


13.3 ”文本 文件 和 字符 流 


上 节 介 绍 了 如 何以 字 节 流 的 方式 处 理 文件 ， 对 于 文本 文件 ， 字 节 
流 没 有 编码 的 概念 ， 不 能 按 行 处 理 ， 使 用 不 太 方便 ， 更 适合 的 是 使 用 
字符 流 ， 本 世 就 来 介绍 字符 流 。 

我 们 首先 简要 介绍 文本 文件 的 基本 概念 、 与 二 进 制 文件 的 区 别 、 
a 以 及 字符 流 和 字 节 流 的 区 别 ， 然 后 介绍 Java 中 的 主要 字符 流 ， 它 
门 有 : 

1) Reader/Writer 字符 流 的 基 类 ， 它 们 是 抽象 类 ; 


2) InputStreamReader/OutputStreamWriter: 适配器 类 ， 将 字 节 流转 
换 为 字符 流 ; 


3) FileReader/FileWriter: 输入 源 和 输出 目标 是 文件 的 字符 流 ; 


4) CharArrayReader/CharArrayWriter: 输入 源 和 输出 目标 是 char 数 
组 的 字符 流 ; 

5) StringReader/StringWriter: 输入 源 和 输出 目标 是 String 的 字符 
流 ; 

6) BufferedReader/BufferedWriter， 装饰 类 ， 对 输入 /输出 流 提 供 绥 
冲 ， 以 及 按 行 读 写 功能 ; 

7) PrintWriter:， 装饰 类 ， 可 将 基本 类 型 和 对 象 转换 为 其 字符 串 形 
式 输出 的 类 。 


除了 这 些 类 ，Java 中 还 有 一 个 类 Scanner， 类 似 于 一 个 Reader， 但 不 
是 Reader 的 了 于 类 ， 可 以 读 取 基 本 类 型 的 字符 串 形 式 ， 类 似 于 PrintWriter 
的 逆 操 作 。 理 解 了 字 蔬 流 和 字符 流 后 ， 我 们 介绍 Java 中 的 标准 输入 输出 
和 销 误 流 。 最 后 ， 我 们 总 结 一 些 简 单 的 实用 方法 。 


13.3.1 基本 概念 


我 们 先 来 看 一 些 基 本 概念 ， 包 括 文 本 文件 、 编 码 和 字符 流 。 
1. 文 本 文件 
上 节 提 到 ， 处 理 文件 要 有 二 进 制 思维 。 从 二 进 制 角度 ， 我 们 通过 


一 个 简单 的 例子 解释 下 文本 文件 与 二 进 制 文件 的 区 别 。 比 如 ， 要 存储 
整数 123， 使 用 二 进 制 形式 保存 到 文件 test.dat， 代 码 为 : 


DataOutputStream output = new Data0utputStream( 
new FileOutputSstream("test.dat")); 


try{ 
output .writeInt(123); 


}finally{ 
output.close( ); 


} 


使 用 UltraEdit 打 开 该 文件 ， 显 示 的 却 是 : 


打开 十 六 进 制 编辑 器 ， 显 示 如 图 13-3 所 示 。 


I testdat @| 


0 i 性 
: | 本 


图 13-3 ”整数 123 的 二 进 制 存 储 


在 文件 中 存储 的 实际 有 4 个 字 节 ， 最 低位 字 节 7B 对 应 的 十 进 制 数 是 
123， 也 就 是 说 ， 对 int 类 型 ， 二 进 制 文件 保存 的 直接 就 是 int 的 二 进 制 形 
式 。 这 个 二 进 制 形式 ， 如 果 当 成 字符 来 解释 ， 显 示 成 什么 字符 则 与 编 
码 有 关 ， 如 果 当 成 UTF-32BE 编 码 ， 解 释 成 的 就 是 一 个 字符 ， 即 { 。 


如 琳 使 用 文本 文件 保存 整数 123， 则 代码 为 : 


OutputStream output = new FileOutputSstream("test.txt"); 
try{ 

String data = Integer ,toString(123); 

output .write(data,getBytes("UTF-8") )， 
}finally{ 


output.close( ); 


代码 将 整数 123 转 换 为 字符 串 ， 然 后 将 它 的 UTF-8 编 码 输出 到 了 文 
件 中 ， 使 用 Ultra-Edit 打 开 该 文件 ， 显 示 的 殉 是 期 望 的 : 


123 


打开 十 六 进 制 编辑 右 ， 显 示 如 图 13-4 所 示 。 


J 0 


00000000h: 31 32 33 [| 
图 13-4 ”整数 123 的 文本 存储 


文件 中 实际 存储 的 有 三 个 字 节 : 31、32、33， 对 应 的 十 进 制 数 分 
别 是 49、50、51， 分 别 对 应 字符 1、'2'、'3' 的 ASCII 编 码 。 


] test.txt 四 


2. 编 码 


在 文本 文件 中 ， 编 码 非 常 重要 ， 同 一 个 子 符 ， 不 同 编码 方式 对 应 
的 二 进 制 形式 可 能 十 不 一 样 的 。 我 们 看 个 例子 ， 对 同样 的 文本 : 


hello，123， 老 马 


1) UTF-8 编 码 ， 十 六 进 制 如 图 13-5 所 示 。 


00000000h: 68 65 6C 6C 6F 2C 20 31 32 33 2C 20 E8 80 81 E9 ; hello, 123, 8..é 
L ; © 


00000010h: A9 AC 


图 13-5 ”示例 文本 的 UTF-8 编 码 
英文 和 数字 字符 每 个 占 一 个 字 节 ， 而 每 个 中 文 占 二 个 字 闻 。 
2) GB18030 编 码 ， 十 六 进 制 如 图 13-6 所 示 。 


00000000h: 68 65 6C 6C 6F 2C 20 31 32 33 2C 20 C0 CF C2 ED ; hello，123，ARATRAI 
00000010h: [| 


图 13-6 “示例 文本 的 GB18030 编 码 


英文 和 数字 字符 与 UTF-8 编 码 是 一 样 的 ， 但 中 文 不 一 样 ， 每 个 中 文 
占 两 个 字 节 。 


3) UTF-16BE 编 码 ， 十 六 进 制 为 如 图 13-7 所 示 。 


00000000h: 00 68 00 65 00 6C 00 6C 00 6F 00 2C 上 20 00 31 ，; 
站 


00000010h: 00 32 00 33 00 2C 00 20 80 01 9A 6C 
图 13-7 示例 文本 的 UTF-16BE 编 码 


无 论 是 美文 还 是 中 文字 符 ， 每 个 字符 都 占 两 个 字 。UTF-16BE 也 
征 Java 内 存 中 对 字符 的 编码 方式 。 


3. 字 符 流 


字 世 流 是 按 字 区 读 取 的 ， 而 字符 流 则 是 按 char 读 取 的 ， 一 个 char 在 
文件 中 保存 的 是 儿 个 字 太 与 编码 有 天， 但 字符 流 封 溉 了 这 种 细 市 ， 我 
们 操作 的 对 象 就 是 char 。 


需要 说 明 的 是 ， 一 个 char 不 完全 等 同 于 一 个 字符 ， 对 于 绝 大 部 分 
字符 ， 一 个 字符 就 是 一 个 char， 但 我 们 之 前 介绍 过 ， 对 于 增补 字符 集中 
的 字符 ， 需 要 两 个 char 表 示 ， 对 于 这 种 字符 ，Java 中 的 字符 流 是 按 char 
而 不 是 一 个 完整 字符 处 理 的 。 


理解 了 文本 文件 、 编 码 和 字符 流 的 概念 ， 我 们 再 来 看 Java 中 的 相关 
类 ， 从 基 类 开始 。 


13.3.2 Reader/Writer 


Reader 与 字 节 流 的 InputStream 类 似 ， 也 是 抽象 类 ， 部 分 主要 方法 
有 : 


public int read() throws IOEXception 

public int read(char cbuf[]) throws IOException 
abstract public void close() throws IOException 
public long skip(long n) throws IOException 
public boolean ready() throws IOException 


方法 的 名 称 和 含义 与 InputStream 中 的 对 应 方法 基本 类 似 ， 但 Reader 
中 处 理 的 单位 是 char， 比 如 read 读 取 的 是 一 个 char， 取 值 范 围 为 0~- 
65535。Reader 没 有 available 方 法 ， 对 应 的 方法 是 ready () 。 


Writer 与 字 世 流 的 OutputStream 类 似 ， 也 是 抽象 类 ， 部 分 主要 方法 
有 : 


public void write(int c) 

public void write(char cbuf[]) 

public void write(String str) throws IOException 
abstract public void close() throws IOException; 
abstract public void flush() throws IOException,; 


含义 与 OutputStream 的 对 应 方法 基本 类 似 ， 但 Writer 处 理 的 单位 是 
char，Writer 还 接受 String 类 型 ， 我 们 知道 ，String 的 内 部 丈 是 char 数 
组 ， 处 理 时 ， 会 调用 String 的 getChar 方 法 移 获 取 char 数 组 。 


13.3.3 InputStreamReader/OutputStreamWriter 


InputStreamReader 和 OutputStreamWriter 是 适配器 类 ， 能 将 
InputStream/OutputStream 转 换 为 Reader/Writer 。 


1.O0utputStream Writer 


OutputStreamWriter 的 主要 构造 方法 为 : 


public OutputStreamwriter(OutputStream out, String charsetName) 


一 个 重要 的 参数 是 编码 类 型 ， 可 以 通过 名 字 charsetName 或 Charset 
对 象 传 入 ， 如 果 没 有 传 入 ， 则 为 系统 默认 编码 ， 默 认 编码 可 以 通过 
Charset.defaultCharset () 得 到 。Output-StreamWriter 内 部 有 一 个 类 型 为 
StreamEncoder 的 编码 屡 ， 能 将 char 转 换 为 对 应 编码 的 字 蔬 。 


我 们 看 一 段 人 简单 的 代码 ， 将 字符 串 "hello，123， 老 马 " 写 到 文件 
hello.txt 中 ， 编 码 格式 为 GB2312: 


Writer writer = new OutputStreamwriter( 
new FileOutputStream("hello.txt"), "GB2312"); 
try{ 
String str = "hel1o，123， 老 马 ") 
writer.write(str); 
}finally{ 
writer.close(); 
} 


创建 一 个 FileOutputStream， 然 后 将 其 包 在 一 个 OutputStreamWiriter 
中 ， 束 可 以 直接 以 字符 串 写 入 了 。 


2.InputStreamReader 


InputStreamReader 的 主要 构造 方法 为 : 


public InputStreamReader(InputStream in) 
public InputStreamReader(InputStream in, String charsetName) 


与 OutputStreamWriter 一 样 ， 一 个 重要 的 参数 是 编码 类 型 。 
InputStreamReader 内 部 有 一 个 类 型 为 StreamDecoder 的 解码 器 ， 能 将 字 
广 根 据 编 码 转 换 为 char 。 


我 们 看 一 段 简单 的 代码 ， 将 上 面 写 入 的 文件 读 进 来 : 


Reader reader = new InputStreamReader( 
new FileInputStream("hello.txt"), "GB2312"); 

try{ 

char[] cbuf = new char[1024]; 

int charsRead = reader.read(cbuf); 

System.out.println(new String(cbuf, 0, charsRead)); 
}finally{ 

reader .close( ); 
} 


这 上 段 代码 假定 一 次 read 调 用 就 读 到 了 所 有 内 容 ， 且 假定 长 度 不 超过 
1024。 为 了 确保 读 到 所 有 内 容 ， 可 以 借助 待 会 介绍 的 CharArrayWriter 或 
StringWriter ° 


13.3.4 FileReader/FileWriter 


FileReader/FileWriter 的 输入 和 目的 是 文件 。FileReader 是 
InputStreamReader 的 子 类 ， 它 的 主要 构造 方法 有 : 


public FileReader(File file) throws FileNotFoundException 
public FileReader(String fileName) throws FileNotFoundException 


FileWriter 是 OutputStreamWriter 的 子 类 ， 它 的 主要 构造 方法 有 : 


public Filewriter(File file) throws IOException 
public Filewriter(String fileName, boolean append) throws IOException 


append 参 数 指定 是 妃 加 还 是 履 盖 ， 如 果 没 传 ， 则 为 履 盖 。 


需要 注意 的 是 ，FileReader/FileWriter 不 能 指定 编码 类 型 ， 只 能 使 用 
默认 编码 ， 如 果 需 要 指定 编码 类 型 ， 可 以 使 用 


InputStreamReader/OutputStream Writer ° 
13.3.5 CharArrayReader/CharArrayWriter 


CharArrayWriter 与 ByteArrayOutputStream 类 似 ， 它 的 输出 目标 是 
char 数 组 ， 这 个 数组 的 长 度 可 以 根据 数据 内 容 动态 扩展 。 


CharArrayWriter 有 如 下 方法 ， 可 以 方便 地 将 数据 转换 为 char 数 组 或 
字符 串 : 


public char[] toCharArray() 
public String toString() 


使 用 CharArrayWriter， 我 们 可 以 改进 上 面 的 读 文 件 人 代码， 确保 将 所 
有 文件 内 容 读 入 : 


Reader reader = new InputStreamReader( 
new FileInputStream("hello.txt"), "GB2312"); 
try{ 


CharArraywriter writer = new CharArraywriter(); 

char[] cbuf = new char[1024]; 

int charsRead = 0; 

while( (charsRead=reader.read(cbuf))!=-1){ 
writer.write(cbuf, 0, charsRead); 


} 
System.out.printlin(writer.toString()); 


}finally{ 
reader .close( ); 


读 入 的 数据 先 写 入 CharArrayWriter 中 ， 读 完 后 ， 再 调用 其 toString 
() 方法 获取 完整 数据 。 


CharArrayReader 与 上 节 介 绍 的 ByteArrayInputStream 类 似 ， 它 将 
char 数 组 包装 为 一 个 Reader， 是 一 种 适配器 模式 ， 它 的 构造 方法 有 : 


public CharArrayReader(char buf[]) 
public CharArrayReader(char buf[], int offset, int length) 


13.3.6 StringReader/StringWriter 


StringReader/StringWriter 与 CharArrayReader/CharArrayWriter 类 似 ， 
只 是 输入 源 为 String， 输 出 目标 为 StringBuffer， 而 且 ， 
String/StringBuffer 内 部 是 由 char 数 组 组 成 的 ， 所 以 它们 本 质 上 是 一 样 
的 ， 具 体 我 们 就 不 痪 述 了 。 之 所 以 要 将 char 数 组 和 String 与 Reader/Writer 
， 也 是 为 了 能 够 方便 地 参与 ReadervWriter 构 成 的 协作 体系 ， 复 


13.3.7 BufferedReader/BufferedWriter 


BufferedReader/BufferedWriter 是 装饰 类 ， 提 供 缓冲 ， 以 及 按 行 读 写 
功能 。Buffered-Writer 的 构造 方法 有 : 


public Bufferedwriter(Writer out) 
public Bufferedwriter(Writer out, int sz) 


参数 sz 是 缓冲 大 小 ， 如 采 没 有 提供 ， 黑 认为 8192。 它 有 如 下 方法 ， 
可 以 输出 平台 特定 的 换行 符 : 


public void newLine() throws IOEXception 


BufferedReader 的 构造 方法 有 : 


public BufferedReader (Reader in) 
public BufferedReader (Reader in, int sz) 


参数 sz 是 缓冲 大 小 ， 如 采 没 有 提供 ， 黑 认 娘 8192。 它 有 如 下 方法 ， 
隔 以 壹 入 一 行 ; 


public String readLine() throws IOException 


字符 r 或 \n 或 \rn' 被 视 为 换行 符 ，readLine 返 回 一 行内 容 ， 但 不 会 
包含 换行 符 ， 当 读 到 流 结尾 时 ， 返 回 null 。 


FileReaderFileWriter 是 没有 缓冲 的 ， 也 不 能 按 行 读 写 ， 所 以 ， 一 般 
应 该 在 它们 的 外 面包 上 对 应 的 缓冲 类 。 我 们 来 看 个 例子 ， 还 是 学 生 列 
表 ， 这 次 我 们 使 用 可 读 的 文本 进行 保存 ， 一 行 保存 一 条 学 生 信 息 ， 学 
生字 上 段 之 间 用 过 号 分 隔 ， 保 存 的 代码 为 : 


public static void writeStudents(List<Student> students) throws IOException{ 
Bufferedwriter writer = null; 
try{ 
writer = new Bufferedwriter(new Filewriter("students.txt")); 
for(Student s : students){ 
writer.write(s.getName()+","+s.getAge()+","+s.getscore()); 
writer.newLine( ); 


} 
}finally{ 
if(writer!=null)t{ 
writer.close(); 
} 


} 
} 


保存 后 的 文件 内 容 显 示 为 : 


张 三 ,18, 80.9 
李 四 , 17, 67.5 


从 文件 中 读 取 的 代码 为 : 


public static List<Student> readStudents() throws IOException{ 
BufferedReader reader = null; 
try{ 
reader = new BufferedReader( 
new FileReader("students.txt")); 
List<Student> students = new ArrayList<>(); 
String line = reader.readLine(); 
while(line!=null){ 
String[] fields = line.split(","); 
Student s = new Student(); 
s.setName(fields[0]); 
s.setAge(Integer.parseInt(fields[1])); 
s.setSscore(Double.parseDouble(fields[2])); 
students.add(s); 
line = reader.readLine(); 


return students,; 
}finally{ 
if(reader!=null)t{ 
reader .close( ); 
} 


} 
} 


使 用 readLine 读 入 每 一 行 ， 然 后 使 用 String 的 方法 分 阳 了 字段， 再 调 
用 Integer 和 Double 的 方法 将 字符 串 转 换 为 int 和 double。 这 种 对 每 一 行 的 
解析 可 以 使 用 类 Scanner 进 行 价 化 ， 得 会 我 们 介绍 。 
13.3.8 PrintWriter 

PrintWriter 有 很 多 重 载 的 print 方 法 ， 如 : 


public void print(int i) 
public void print(Object obj) 


它 会 将 这 些 参数 转换 为 其 字符 串 形 式 ， 即 调用 String.valueOf 
JW ， 然 后 再 调用 write。 它 也 有 很 多 重 载 形式 的 println 方 法 ，println 除 
了 调用 对 应 的 print， 还 会 输出 一 个 换行 符 。 除 此 之 外 ，PrintWriter 丰 有 
格式 化 输出 方法 ， 如 : 


public Printwriter printf(String format, Object ... args) 


format 表 示 格 式 化 形式 ， 比 如 ， 保 留 小 数 点 后 两 位 ， 格 式 可 以 为 : 


Printwriter writer = ... 
writer.format("%.2f", 123.456f); 


输出 为 : 
123.45 


更 多 格式 化 的 内 容 可 以 参看 API 文 档 ， 本 市 就 不 袭 述 了 。 


PrintWriter 的 方便 之 处 在 于 ， 它 有 很 多 构造 方法 ， 可 以 接受 文件 路 
径 名 、 文 件 对 象 、OutputStreaam、Writer 等 ， 对 于 文件 路 径 名 和 File 对 
象 ， 还 可 以 接受 编码 类 型 作为 参数 ， 比 如 : 


public Printwriter(File file) throws FileNotFoundException 
public Printwriter(String fileName, String csn) 

public Printwriter(OutputStream out, boolean autoFlush ) 
public Printwriter(Writer out) 


参数 csn 表 示 编 码 类 型 ， 对 于 以 文件 对 象 和 文件 名 为 参数 的 构造 方 
法 ，PrintWriter 内 部 会 构造 一 个 BufferedWriter， 比 如 : 


public Printwriter(String fileName) throws FileNotFoundException { 
this(new Bufferedwriter(new OutputStreamwriter( 
new FileOutputStream(fileName))), false); 


对 于 以 OutputSream 为 参数 的 构造 方法 ，PrintWriter 也 会 构造 一 个 
BufferedWriter， 比 如 : 


public Printwriter(OutputStream out, boolean autoFlush) { 
this(new Bufferedwriter(new OutputStreamwriter(out)), autoFlush); 


对 于 以 Writer 为 参数 的 构造 方法 ，PrintWriter 束 不 会 包装 
BufferedWriter 1 。 


构造 方法 中 的 autoFlush 参 数 表 示 同 步 缓冲 区 的 时 机 ， 如 果 为 true， 
则 在 调用 println、printf 或 format 方 法 的 时 候 ， 同 步 缓冲 区 ， 如 果 没 有 
传 ， 则 不 会 自动 同步 ， 需 要 根据 情况 调用 flush 方 法 。 

可 以 看 出 ，PrintWriter 是 一 个 非常 方便 的 类 ， 可 以 直接 指定 文件 名 
作为 参数 ， 可 以 指定 编码 类 型 ， 可 以 目 动 缓冲 ， 可 以 自动 将 多 种 类 型 
转换 为 字符 串 ， 在 输出 到 文件 时 ， 可 以 优先 选择 该 类 。 


上 面 的 保存 学 生 列表 代码 ， 使 用 PrintWriter， 可 以 写 为 : 


public static void writeStudents(List<Student> students) throws IOException{ 
Printwriter writer = new PrintwWriter("students.txt"),; 


try{ 
for(Student s : Students){ 
writer.println(s.getName()+","+s.getAge()+","+s.getScore()); 


} 
}finally{ 
writer.close(); 
} 


} 


PrintWriter 有 一 个 非常 相似 的 类 PrintStream， 除 了 不 能 接受 Writer 作 
为 构造 方法 外 ，PrintStream 的 其 他 构造 方法 与 PrintWriter 一 样 。 
PrintStream 也 有 几乎 一 样 的 重 载 的 print 和 printn 方 法 ， 只 是 目 动 同 步 组 
冲 区 的 时 机 略 有 不 同 ， 在 PrintStream 中 ， 只 要 们 到 一 个 换行 字符 \n'， 
就 会 目 动 同步 缓 促 区 。PrintStream 与 PrintWriter 的 男 一 个 区 别 是 ， 虽 然 
它们 都 有 如 下 方法 : 


public void write(int b) 


但 含义 是 不 一 样 的 ，PrintStream 只 使 用 最 低 的 8 位 ， 输 出 一 个 字 
节 ， 而 PrintWriter 是 使 用 最 低 的 两 位 ， 输 出 一 个 char 。 


13.3.9 Scanner 


Scanner 是 一 个 单独 的 类 ， 它 是 一 个 简单 的 文本 扫 摘 絮 ， 能 够 分 析 
基本 类 型 和 字符 串 ， 它 需要 一 个 分 隔 符 来 将 不 同 数据 区 分 开 来 ， 默 认 
是 使 用 空白 符 ， 可 以 通过 useDelimiter () 方法 进行 指定 。Scanner 有 很 
多 形式 的 next () 方法 ， 可 以 读 取 下 一 个 基本 类 型 或 行 ， 如 : 


public float nextFloat() 
public int nextInt() 
public String nextLine() 


Scanner 也 有 很 多 构造 方法 ， 可 以 接受 File 对 象 、InputStream、 
Reader 作 为 参数 ， 它 也 可 以 将 字符 串 作 为 参数 ， 这 时 ， 它 会 创建 一 个 
比如 ， 以 前 面 的 解析 学 生 记 录 为 例 ， 使 用 Scanner， 代 人 码 
可 以 改 为 : 


public static List<Student> readStudents() throws IOExceptionf{ 
BufferedReader reader = new BufferedReader( 
new FileReader("students.txt")); 
try{ 
List<Student> students = new ArrayList<Student>(); 
String line = reader.readLine(); 
while(line!=null){ 
Student s = new Student(); 
Scanner Scanner = new Scanner(line).useDelimiter(","); 
s.setName(scanner .next()); 
s.setAge(scanner.nextInt()); 
s.setSscore(scanner.nextDouble()); 
students.add(s); 
line = reader.readLine(); 


return students,; 
}finally{ 
reader .close( ); 


13.3.10 ”标准 流 


我 们 之 前 一 直 在 使 用 System.out 向 屏幕 上 输出 ， 它 是 一 个 
PrintStream 对 象 ， 输 出 目标 下 是 所 谓 的 “标准 ”输出 ， 经 常 是 屏 融 。 除 了 
System.out，Java 中 还 有 两 个 标准 流 : System.in 和 System.err 。 


System.ipn 表 示 标 准 输入 ， 它 是 一 个 InputStream 对 象 ， 输 入 源 经 芝 
是 键盘 。 比 如 ， 从 键盘 接受 一 个 整数 并 和 输出， 代码 可 以 为 : 


Scanner in = new Scanner(System,.in)， 
int num = in,nextInt()， 
System.out.printin(num); 


System.err 表 示 标 准 错误 流 ， 一 般 异 党 和 错误 信息 输出 到 这 个 流 ， 
它 也 是 一 个 Print-Stream 对 象 ， 输 出 目标 默认 与 System.out 一 样 ， 一 般 也 
日 + 
是 屏 只 。 


标准 流 的 一 个 重要 特点 是 ， 它 们 可 以 重 是 辣 ， 比 如 可 以 重 定 同 到 
文件 ， 从 文件 中 接受 输入 ， 和 输出 也 写 到 文件 中 。 在 Java 中 ， 可 以 使 用 
System 类 的 settmnm 、setOut、setErrj 井 行 重 定 同 ， 比 如 : 


System.setIin(new ByteArrayInputStream("hello".getBytes("UTF-8"))); 
System.setOut(new PrintStream("out.txt")); 
System.setErr(new PrintStream("err.txt")); 


try{ 
Scanner in = new Scanner(System.in); 
System.out.printin(in.nextLine()); 
System.out.printin(in.nextLine()); 
}catch(Exception e){ 
System.err.printlin(e.getMessage()); 


} 


标准 输入 重 定 癌 到 了 一 个 ByteArrayInputStream， 标 准 输 出 和 错误 
重 定向 到 了 文件 ， 所 以 第 一 次 调用 in.nextLine 束 会 读 取 到 "hello"， 输 出 
文件 out.txt 中 也 包含 该 字符 串 ， 第 二 次 调用 in.nextLine 会 触发 异常 ， 异 
和 常 消 奶 会 写 到 错误 流 中 ， 即 文件 err.txt 中 会 包含 异常 消 轧 ， 为 "No line 
found" ° 


在 实际 开发 中 ， 经 常 需 要 重 定 向 标准 流 。 比 如 ， 在 一 些 自 动 化 程 
序 中 ， 经 冲 需 要 重 定 向 标准 输入 流 ， 以 从 文件 中 接受 参数 ， 目 动 执 
行 ， 避 免 人 手工 输入 。 在 后 台 运 行 的 程序 中 ， 一 般 都 需要 重 定向 标准 
输出 和 错误 流 到 日 志文 件 ， 以 记录 和 分 析 运 行 的 状态 和 问题 。 


在 Linux 系 统 中 ， 标 准 输 入 输出 流 也 是 一 种 重要 的 协作 机 制 。 很 多 
命令 都 很 小 ， 只 完成 单一 功能 ， 实 际 完成 一 项 工作 经 常 需要 组 合 使 用 
多 条 命令 ， 它 们 协作 的 模式 就 是 通过 标准 输入 输出 流 ， 每 个 命令 都 可 
以 从 标准 输入 接受 参数 ， 处 理 结 采 写 到 标准 输出 ， 这 个 标准 输出 可 以 
连接 到 下 一 个 命令 作为 标准 输入 ， 构 成 管道 式 的 处 理 链 条 。 比 如 ， 得 
找 一 个 日 志文 件 access.log 中 127.0.0.1 出 现 的 行 数 ， 可 以 使 用 命令 : 


cat access.10og | grep 127.0.0.1 | wc -1 


有 三 个 程序 cat、grep、wc，| 是 管道 符号 ， 它 将 cat 的 标准 输出 重 定 
回 为 了 grep 的 标准 输入 ， 而 grep 的 标准 输出 又 成 了 wc 的 标准 输入 。 


13.3.11 实用 方法 


可 以 看 出 ， 字 符 流 也 包含 了 很 多 的 类 ， 虽 然 很 灵活 ， 但 对 于 一 些 
简单 的 需求 ， 却 需要 写 很 多 代码 ， 实 际 开发 中 ， 经 常 需要 将 一 些 常 用 
功能 进行 封装 ， 提 供 更 为 简单 的 接口 。 下 面 我 们 提供 一 些 实用 方法 ， 
以 供 参考 ， 代 码 比较 简单 ， 就 不 解释 了 。 


复制 Reader 到 Writer， 代 码 为 : 


public static void copy(final Reader input， 
final Writer output) throws IOEXception { 
char[] buf = new char[4096]; 
int charsRead = 0; 
while((charsRead = input.read(buf)) != -1) { 
output.write(buf, 0, charsRead); 
} 


} 


人 参数 为 文件 名 和 编码 类 型 ， 


public static String readFileToString(final String fileName, 
final String encoding) throws IOEXxception{ 
BufferedReader reader = null; 
try{ 
reader = new BufferedReader(new InputStreamReader( 
new FileInputStream(fileName)，encoding) )， 
Stringwriter writer = new Stringwriter(); 
copy(reader, writer); 
return writer.toString()， 
}finally{ 
if(reader!=null1){ 
reader .close( ); 
} 


} 
} 


这 个 方法 利用 了 StringWriter， 并 调用 了 上 面 的 复制 方法 。 


Us 参数 为 文件 名 、 子 符 串 内 容 和 编码 类 型 ， 代 


public static void writeStringToFile(final String fileName, 
final String data, final String encoding) throws IOException f{ 


Writer writer = null; 
try{ 
writer = new OutputStreamwriter( 

new FileOutputStream(fileName), encoding); 
writer.write(data); 


}finally{ 
if(writer!=null)t{ 
writer.close(); 
} 


按 行将 多 行 数据 写 到 文件 ， 参 数 为 文件 名 、 编 码 类 型 、 行 的 集 


合 ， 代 码 为 : 


public static void writeLines(final String fileName, final String encoding, 
final Collection<?> lines) throws IOException { 


Printwriter writer = null; 
try{ 
writer = new Printwriter(fileName, encoding); 
for(Object line : lines){ 
writer.printin(line); 


} 
}finally{ 
if(writer!=null)t{ 
writer.close(); 


} 


Se 参数 为 文件 名 、 编 码 类 型 ， 


public static List<String> readLines(final String fileName, 
final String encoding) throws IOExceptionf{ 
BufferedReader reader = null; 


try{ 
reader = new BufferedReader(new InputStreamReader( 
new FileInputStream(fileName), encoding)); 
List<String> list = new ArrayList<>(); 
String line = reader.readLine(); 
while(line!=null){ 
list.add(line); 
line = reader.readLine(); 
} 
return list,; 
}finally{ 
if(reader!=null){ 
reader .close( ); 


} 


代 


13 二 1 相知 


本 下 介绍 了 如 何在 Java 中 以 字符 流 的 方式 读 写 文 本 文件 ， 我 们 强调 
了 二 进 制 思维 、 文 本 文本 与 二 进 制 文件 的 区 别 、 编 码 ， 以 及 字符 流 与 
字 太 流 的 不 同 ， 介 绍 了 个 各 种 字符 流 、Scanner 以 及 标准 流 ， 最 后 总 结 
了 一 些 实用 方法 。 完 整 的 代码 在 github 上 ， 地 址 为 
https://github.com/swiftma/program-logic ， 位 于 包 shuo.laoma.file.c58 
Ts 


写 文 件 时 ， 可 以 优先 考虑 PrintWriter， 因 为 它 使 用 方便 ， 支 持 自动 
缓冲 、 指 定编 码 类 型 、 类 型 转换 等 。 读 文件 时 ， 如 果 需 要 指定 编码 类 
型 ， 需 要 使 用 InputStreamReader; 如 果 不 需要 指定 编码 类 型 ， 可 使 用 
FileReader， 但 都 应 该 考虑 在 外 面包 上 缓冲 类 Buffered-Reader 。 


通过 前 面 两 个 小 节 ， 我 们 应 该 可 以 从 容 地 读 写 文件 内 容 了 ， 但 文 
件 和 目录 本 喘 的 操作 ， 如 查看 元 数据 信息 、 文 件 重 命 名 、 汤 历 文件 、 
查找 文件 、 新 建 目 孙 等 ， 又 该 如 何 进行 呢 ? 让 我 们 下 市 介绍 。 


13.4 文件 和 目 孙 操作 


文件 和 目录 操作 最 终 是 与 操作 系统 和 文件 系统 相关 的 ， 不 同系 统 
的 实现 是 不 一 样 的 ， 但 Java 中 的 java.io.File 类 提供 了 统一 的 接口 ， 底 层 
会 通过 本 地 方法 调用 操作 系统 和 文件 系统 的 具体 实现 ， 本 市 ， 我 们 就 
来 介绍 File 类 。File 类 中 的 操作 大 概 可 以 分 为 三 类 : 文件 元 数据 、 文 件 
` 目录 操作 ， 在 介绍 这 些 操作 之 前 ， 我 们 先 来 看 下 File 的 构造 方 
潜 。 


13.4.1 构造 方法 


File 既 可 以 表示 文件 ， 也 可 以 表示 目录 ， 它 的 主要 构造 方法 有 : 


//pathname 表 示 完 整 路 径 ， 该 路 径 可 以 是 相对 路 径 ， 也 可 以 是 绝对 路 径 
public File(String pathname) 

//parent 表 示 父 目录 ，chil1d 表 示 孩 子 

public File(String parent, String child) 

public File(File parent, String child) 


File 中 的 路 径 可 以 是 已 经 存在 的 ， 也 可 以 是 不 存在 的 。 通 过 new 新 
建 一 个 File 对 象 ， 不 会 实际 创建 一 个 文件 ， 只 是 创建 一 个 表示 文件 或 
目录 的 对 象 ，new 之 后 ，File 对 象 中 的 路 径 是 不 可 变 的 。 


13.4.2 ”文件 元 数据 


文件 元 数据 主要 包括 文件 名 和 路 径 、 文 件 基 本 信息 以 及 一 些 安全 
和 权限 相关 的 信息 。 文 件 名 和 路 人 径 相 关 的 主要 方法 有 : 


public String getName() // 返 回 文 件 或 目录 名 称 ， 不 含 路 径 名 

public boolean isAbsolute() // 判 断 File 中 的 路 径 是 否 是 绝对 路 径 

public String getPath() // 返 回 构造 File 对 象 时 的 完整 路 径 名 ， 包 括 路 径 和 文件 名 称 
public String getAbsolutePath() // 返 回 完整 的 绝对 路 径 名 

// 返 回 标准 的 完整 路 径 名 ， 它 会 去 掉 路 径 中 的 元 余 名 称 如 "."," .."， 跟 踪 软 链接 ( Unix 系统 概 念 ) 等 
public String getCanonicalPath() throws IOException 

public String getParent() // 返 回 父 目录 路 径 
public File getParentFile() // 返 回 父 目 录 的 File 对 象 

// 返 回 一 个 新 的 File 对 象 ， 新 的 File 对 象 使 用 getAbsolutePath( ) 的 返回 值 作为 参数 构造 
public File getAbsoluteFile() 


// 返 回 一 个 新 的 File 对 象 ， 新 的 File 对 象 使 用 getcanonicalPath( ) 的 返回 值 作为 参数 构造 
public File getCanonicalFile() throws IOException 


这 些 方法 比较 直观 ， 我 们 惑 不 解释 了 。File 类 中 有 4 个 静态 变量 ， 
表示 路 径 分 阳 符 ， 它 们 是 : 


public static final String separator 
public static final char separatorChar 
public static final String pathSeparator 
public static final char pathSeparatorChar 


separator 和 separatorChar 表 示 文 件 路 径 分 隔 符 ， 在 Windows 系 统 
中 ， 一 般 为 N\，Linux 系 统 中 一 般 为 /。pathSeparator 和 
pathSeparatorChar 表 示 多 个 文件 路 径 中 的 分 隔 符 ， 比 如 ， 环 境 变量 
PATH 中 的 分 隅 符 ，Java 类 路 径 变量 classpath 中 的 分 隅 符 ， 在 执行 命令 
时 ， 操 作 系 统 会 从 PATH 指定 的 目 孙 中 寻找 命令 ，Java 运 行 时 加 载 class 
文件 时 ， 会 从 classpath 指 中 的 路 任 中 寻找 类 文件 。 在 Windows 系 统 中 ， 
这 个 分 隔 符 一 般 为 ; '， 在 Linux 系 统 中 ， 这 个 分 隔 符 一 般 为 : 


除了 文件 名 和 路 径 ，File 对 象 还 有 如 下 方法 ， 以 获取 文件 或 目录 
的 基本 信息 : 


public boolean exists() // 文 件 或 目录 是 否 存在 
public boolean isDirectory() // 均 合 也 
public boolean isFile() // 是 否 否 为 文件 
public long length() // 文 件 长 度 ， 字 节 数 ， 对 目录 没有 意义 

public long lastModified() // 最 后 修改 时 间 ， 从 纪元 时 开始 的 毫秒 数 

public boolean setLastModified(long time) // 设 置 最 后 修改 时 间 ， 返 回 是 否 修改 成 功 


需要 说 明 的 是 ，File 对 象 没 有 返回 创建 时 间 的 方法 ， 因 为 创建 时 
间 不 是 一 个 公共 概念 ，Linux/Unix 就 没有 创建 时 间 的 概念 。 


File 类 中 与 安全 和 权限 相关 的 主要 方法 有 : 


public boolean isHidden() // 是 否 为 隐藏 文件 
public boolean canExecute() // 是 否 可 执行 
public boolean canRead() // 是 否 可 读 
public boolean canwrite() // 是 否 可 写 
public boolean setReadonly() // 设 置 文件 为 只 读 文件 
// 修 改 文件 读 权 限 

public boolean setReadable(boolean readable, boolean ownerOonly) 
public boolean setReadable(boolean readable) 


// 修 改 文 件 写 权 限 

public boolean setwritable(boolean writable, boolean ownerOnly) 
public boolean setwritable(boolean writable) 

// 修 改 文件 可 执行 权限 

public boolean setExecutable(boolean executable, boolean ownerOonly) 
public boolean setExecutable(boolean executable) 


在 修改 方法 中 ， 如 有 果 修 改 成 功 ， 返 回 true， 否 则 返回 false。 在 设置 
权限 方法 中 ，owner-Only 为 true 表 示 只 针对 owner， 为 false 表 示 针 对 所 
有 用 户 ， 没 有 指定 ownerOnly 的 方法 中 ，ownerOnly 相 当 于 是 true。 


13.4.3 ”文件 操作 


文件 操作 主要 有 创建 、 删 除 、 重 命名 。 
新 建 一 个 File 对 象 不 会 实际 创建 文件 ， 但 如 下 方法 可 以 : 


public boolean createNewFile() throws IOException 


创建 成 功 返 回 true， 否 则 返回 false， 新 创建 的 文件 内 容 为 空 。 如 果 
文件 已 存在 ， 不 会 创建 。 


File 对 象 还 有 两 个 静态 方法 ， 可 以 创建 临时 文件 : 


public static File createTempFile(String prefix, String suffix) 
throws IOException 

public static File createTempFile(String prefix, String suffix, 
File directory) throws IOException 


临时 文件 的 完整 路 径 名 是 系统 指定 的 、 唯 一 的 ， 但 可 以 通过 参数 
指定 前 级 (prefix) 、 后 组 (suffix) 和 目录 (directory) 。prefix 是 必 
需 的 ， 且 人 至少 要 三 个 字符 ，suffix 如 果 为 null， 则 默认 为 .tmp; directory 
如 果 不 指 定 或 指定 为 null， 则 使 用 系统 默认 目录 。 


File 类 的 删除 方法 为 : 


public boolean delete() 
public void deleteOnExit() 


delete 删 除 文件 或 目 孙 ， 删 除 成 功 返 回 true， 否 则 返回 false。 如 果 
File 是 目 孙 且 不 为 宝 ， 则 delete 不 会 成 功 ， 返 回 false， 换 句 话 说， 要 删 
除 日 录 ， 先 要 删除 目录 下 的 所 有 子 目 录 和 文件 。deleteOnExit 将 File 对 
象 加 入 到 待 删 列 表 ， 在 Java 虚 拟 机 正常 退出 的 时 候 进行 实际 删除 。 


File 类 的 重 命名 方法 为 : 


public boolean renameTo(File dest) 


参数 dest 代 表 重 命名 后 的 文件 ， 重 命名 能 人 否 成 功 与 系统 有 关 ， 返 
回 值 代表 是 否 成 功 。 


13.4.4 ”目录 操作 


和 当 File 对 和 象 代表 目录 时 ， 可 以 执行 目录 相关 的 操作 ， 如 创建 、 裔 
力 o 


有 两 个 方法 用 于 创建 目录 : 


public boolean mkdir() 
public boolean mkdirs() 


它们 都 是 创建 目录 ， 创 建成 功 返 回 rue， 失 败 返 回 false。 需 要 注意 
的 是 ， 如 果 目 录 已 存在 ， 返 回 值 是 false。 这 两 个 方法 的 区 别 在 于 : 如 
果 革 一 个 中 间 父 目录 不 存在 ， 则 mkdir 会 失败 ， 返 回 false， 而 mkdirs 则 
会 创建 必需 的 中 间 父 目录 。 


有 如 下 方法 访问 一 个 目录 下 的 子 目录 和 文件 : 


public String[] list() 

public String[] list(FilenameFilter filter) 
public File[] listFiles() 

public File[] listFiles(FileFilter filter) 
public File[] listFiles(FilenameFilter filter) 


它们 返回 的 都 是 直接 子 目 隶 或 文件 ， 不 会 返回 子 目 录 下 的 文件 。 
list 返 回 的 是 文件 名 数组 ， 而 listFiles 返 回 的 是 File 对 象 数组 。 
FilenameFilter 和 FileFilter 都 是 接口 ， 用 于 过 滤 ，FileFilter 的 定义 为 : 


public interface FileFilter f{ 
boolean accept(File pathname); 


FilenameFilter 的 定义 为 : 


public interface FilenameFilter { 
boolean accept(File dir, String name); 
} 


在 遇 历 子 目 永和 文件 时 ， 针 对 每 个 文件 ， 会 调用 FilenameFilter 或 
FileFilter 的 accept 方 法 ， 只 有 accept 方 法 返回 true 时 ， 才 将 该 子 目 孙 或 文 
件 包含 到 返回 结果 中 。Filename-Filter 和 FileFilter 的 区 别 在 于 : 
FileFilter 的 accept 方 法 参数 只 有 一 个 File 对 象 ， 而 File-nameFilter 的 
accept 方 法 参数 有 了 两 个 ，dir 表 示 父 目录 ，name 表 示 子 目录 或 文件 名 。 
0 ， 列 出 当前 目录 下 的 所 有 扩展 名 为 .txt 的 文件 ， 代 码 可 


File f = new File("."); 
File[] files = f.1listFiles(new FilenameFilter(){ 
QOverride 
public boolean accept(File dir, String name) { 
if(name.endswith(".txt"))t{ 
return true; 


return false,; 
} 
}); 


我 们 创建 了 个 FilenameFilter 的 匿名 内 部 类 对 象 并 传递 给 了 


listFiles ° 


使 用 过 有 历 方法 ， 可 以 方便 地 进行 递归 通 历 ， 完 成 一 些 更 为 高 级 的 
oo 计算 一 个 目录 下 的 所 有 文件 的 大 小 (包括 子 目录 ) ， 代 
9] 以 大 : 


public static long sizeOfDirectory(final File directory) { 
long size = 0; 
if(directory.isFile()) { 
return directory, length() ; 
} else { 
for(File file : directory.listFiles()) { 
if(file.isFile()) { 
size += file.length(); 
} else { 
size += sizeOfDirectory(file); 
} 


} 
} 


return size; 


a 再 如 ， 在 一 个 目录 下 ， 查 找 所 有 给 定 文件 名 的 文件 ， 代 码 可 以 


public static Collection<File> findFile(final File directory, 
final String fileName) { 
List<File> files = new ArrayList<>(); 
for(File f : directory.listFiles()) { 
if(f.isFile() && f.getName().equals(fileName)) { 
files.add(f); 
} else if(f.isDirectory()) { 
files.addAll(findFile(f, fileName)); 
} 


return files,; 


前 面 介 绍 了 File 类 的 delete 方 法 ， 我 们 提 到 ， 如 琳 要 删除 目录 而 目 
采 不 为 空 ， 和 需要 先 清空 目录 ， 利 用 损 历 方法 ， 我 们 可 以 写 一 个 删除 非 
空 目录 的 方法 ， 代 码 可 以 为 : 


public static void deleteRecursively(final File file) throws IOException { 
if(file.isFile()) { 
if(!file.delete()) { 
throw new IOException("Failed to delete " 
+ file.getCcanonicalpath()); 


} 
} else if(file.isDirectory()) { 
for(File child : file.]listFiles()) { 
deleteRecursively(child); 


} 
if(!file.delete()) { 
throw new IOException("Failed to delete " 
+ file,getCcanonicalPath() )， 


完整 的 代码 在 github 上 ， 地 址 为 https://github.com/swiftma/program- 
logic ， 位 于 包 shuo.laoma.file.c59 下 。 人 至 此 ， 关 于 File 类 就 介绍 完了 ， 
File 类 封 狼 了 操作 系统 和 文件 系统 的 差异 ， 提 供 了 统一 的 文件 和 目录 
API° 


关于 文件 处 理 的 基本 技术 ， 包 括 文件 的 基本 概念 、 二 进 制 文件 与 


字 市 流 、 文 本 文件 与 字符 流 ， 以 及 文件 和 目 隶 操作， 至此， 我 们 整 介 
绍 完 了 。 下 一 章 ， 我 们 来 看 文件 处 理 相 关 的 一 些 高 级 技术 。 


第 14 章 ”文件 高 级 技术 


在 日 常 编程 中 ， 我 们 经 常会 需要 处 理 一 些 具 体 类 型 的 文件 ， 如 属 
性 文件 、CSV、Excel、HTML 和 压缩 文件 ， 直 接 使 用 上 一 章 介 绍 的 方 
式 来 处 理 一 般 是 很 不 方便 的 。 一 些 第 三 方 的 类 库 基 于 之 前 介绍 的 技术 
0 
图。 


上 一 章 介绍 了 字 世 流 和 字符 流 ， 它 们 都 是 以 流 的 方式 读 写 文 件 ， 
流 的 方式 有 几 个 限制 : 


1) 要 么 读 ， 要 么 写 ， 不 能 同时 读 和 写 。 


2) 不 能 随机 读 写 ， 只 能 从 头 读 到 尾 ， 且 不 能 重复 读 ， 虽 然 通 过 组 
冲 可 以 实现 部 分 重读 ， 但 是 有 限制 。 


Java 中 还 有 一 个 类 RandomAccessFile， 它 没有 这 两 个 限制 ， 既 可 
封装 类 。 


访问 文件 还 有 一 种 方式 ， 内 存 映射 文件 ， 它 可 以 高 效 处 理 非常 大 
的 文件 ， 而 且 可 以 被 多 个 不 同 的 应 用 程序 共 圣 ， 特 别 适 合用 于 不 同 应 
用 程序 之 间 的 通信 。 


在 前 面 章 广 ， 我 们 在 将 对 象 保存 到 文件 时 ， 使 用 的 是 
DataOutputStream， 从 文件 读 入 对 象 时 ， 使 用 的 是 DataInputStream， 使 
用 它们 ， 需 要 逐个 处 理 对 象 中 的 每 个 字段 ， 我 们 提 到 ， 这 种 方式 比较 
虽 唆 ，Java 中 有 一 种 更 为 简 单 的 机 制 ， 那 就 是 序列 化 。 


Java 的 标准 序列 化 机 制 有 一 些 重要 的 限制 ， 而 且 不 能 跨 语言 ， 实 
践 中 经 常 使 用 一 些 蔡 代 方 案 ， 比 如 XML/JSON/MessagePack 。Java 
SDK 中 对 这 些 格式 的 支持 有 限 ， 有 很 多 第 三 方 的 类 库 提 供 了 更 为 方便 
的 文 持 ，Jackson 是 其 中 一 种 ， 它 文 持 多 种 格式 。 


本 章 主要 就 来 介绍 以 上 这 些 技术 ， 有 具体 分 为 5 个 小 节 : 14.1 节 介绍 
几 种 销 见 文件 类 型 的 处 理 ;，14.2 世 介绍 RandomAccessFile， 演 示 它 的 一 
个 应 用 ， 实 现 一 个 简单 的 键 值 对 数据 库 ; 14.3 布 介绍 内 存 映 射 文件 ， 


演示 它 的 一 个 应 用 ， 设 计 和 实现 一 个 简单 的 、 持 久 化 的 、 跨 程序 的 消 
息 队 列 ，14.4 广 介绍 Java 标 准 友 列 化 机 制 ，14.5 广 介绍 利用 Jackson 序 列 
化 为 XML/JSON/MessagePack 。 


14.1 第 见 文件 类 型 处 理 


本 太 简 要 介绍 如 何 利用 Java API 和 一 些 第 三 方 类 库 ， 来 处 理 如 下 5 
种 类 型 的 文件 : 


1) 属性 文件 ， 属 性 文件 是 常见 的 配置 文件 ， 用 于 在 不 改变 代码 的 
情况 下 改变 程序 的 行为 


2) CSV: CSV 是 Comma-Separated Values 的 缩写 ， 表 示 喜 号 分 隅 
值 ， 是 一 种 非常 常见 的 文件 类 型 。 大 部 分 日 志文 件 都 是 CSV，CSV 世 
经 常用 于 交换 表格 类 型 的 数据 ， 竺 会 我 们 会 看 到 ，CSV 看 上 去 很 简 
单 ， 但 处 理 的 复杂 性 经 党 被 低估 。 


3) Excel: 在 编程 中 ， 经 常 需要 将 表格 类 型 的 数据 导出 为 Excel 格 
式 ， 以 方便 用 户 查看 ， 也 经 常 需要 接受 Excel 类 型 的 文件 作为 输入 以 批 
量 导 入 数据 。 

4) HTML: 所 有 网 页 都 是 HTML 格 式 ， 我 们 经 常 需要 分 析 HTML 
网 页 ， 以 从 中 提取 感 兴趣 的 信息 。 


5) 压缩 文件 : 压缩 文件 有 多 种 格式 ， 也 有 很 多 压缩 工具 ， 大 部 分 
情况 下 ， 我 们 可 以 借助 工具 而 不 需要 目 己 写 程序 处 理 压 缩 文 件 ， 但 茶 
些 情况 下 ， 需 要 上 自己 编程 压缩 文件 或 解压 缩 文件 。 


14.1.1 属性 文件 


属性 文件 一 般 很 油 单 ， 一 行 表示 一 个 属性 ， 属 性 就 是 键 值 对 ， 键 
和 值 用 等 号 (=) 或 冒号 (: ) 分 隔 ， 一 般 用 于 配置 程序 的 一 些 参数 。 
在 需要 连接 数据 库 的 程序 中 ， 经 常 使 用 配置 文件 配置 数据 库 信息 。 比 
如 ， 设 有 文件 config.properties， 内 容 大 概 如 下 所 示 : 


db.host = 192.168.10.100 
db.port : 3306 
db.username = zhangsan 
db.password = mima1i234 


处 理 这 种 文件 使 用 字符 流 是 比较 容易 的 ， 但 Java 中 有 一 个 专门 的 类 
java.util.Properties， 它 的 使 用 也 很 商 单 ， 有 如 下 主要 方法 : 


public synchronized void Load(InputStream inStream) 
public String getProperty(String key) 
public String getProperty(String key，String defaultValue) 


load 用 于 从 流 中 加 载 属 性 ，getProperty 用 于 获取 属性 值 ， 可 以 提供 
一 个 默认 值 ， 如 果 没 有 找到 配置 的 值 ， 则 返回 默认 值 。 对 于 上 面 的 配 
置 文 件 ， 可 以 使 用 类 似 下 面 的 代码 进行 读 取 : 


Properties prop = new Properties!(); 
prop.load(new FileInputStream("config.properties")); 
String host = prop.getProperty("db.host"); 


int port = Integer.valueof(prop.getProperty("db.port", "3306")); 


使 用 类 Properties 处 理 属 性 文件 的 好 处 是 : 

可 以 目 动 处 理 空格 ,分 阳 符 = 前 后 的 空格 会 被 目 动 忽 略 。 

可 以 目 动 忽略 空 行 。 

可 以 添加 注释 ， 以 字符 # 或 ! 开头 的 行 会 被 视 为 注释 ， 进 行 忽略 。 


使 用 Properties 也 有 限制 ， 它 不 能 直接 处 理 中 文 ， 在 配置 文件 中 ， 


所 有 非 ASCII 字 符 需 要 使 用 Unicode 编 码 。 比如 ， 不 能 在 配置 文件 中 直 
接 这 么 写 : 


name= 老 马 


“ 老 马 ”需要 替换 为 Unicode 编 码 ， 如 下 所 示 : 


name=\u8001\u9A6C 


在 Java IDE (如 Eclipse) 中 ， 如 果 使 用 属性 文件 编辑 器 ， 它 会 自动 
蕉 换 中 文 为 Unicode 编 码 ， 如 末 使 用 其 他 编辑 融 ， 可 以 先 写成 中 文 ， 然 


后 使 用 JDK 提 供 的 命令 native2ascii 转 换 为 Unicode 编 码 。 用 法 如 下 例 所 
修 \: 


native2ascii -encoding UTF-8 native.properties ascii,.properties 


native.properties 是 输入 ， 其 中 包含 中 文 ; ascii.properties 是 输出 ， 中 
文 蔡 换 为 了 Unicode 编 码 ; -encoding 指 定 输入 文件 的 编码 ， 这 里 指定 为 
TUTF-8° 


14.1.2 ”CSV 文件 


CSV 是 Comma-Separated Values 的 缩写 ， 表 示 喜 号 分 隔 值 。 一 般 而 
言 ， 一 行 表示 一 条 记录 ， 一 条 记录 包含 多 个 字段 ， 字 上 段 之 间 用 过 号 分 
隔 。 不 过 ， 一 般 而 言 ， 分 隔 符 不 一 定 是 逗号 ， 可 能 是 其 他 字符 ， 如 tab 
符 \t、 冒 号 ':'、 分 号 ';' 等 。 程 序 中 的 各 种 日 志文 件 通 常 是 CSV 文 件 ， 
在 导入 导出 表格 类 型 的 数据 时 ，CSV 也 是 经 常用 的 一 种 格式 。 


CSV 格 式 看 上 去 很 简单 。 比 如 ， 我 们 在 上 一 章 保 存 学 生 列 表 时 ， 
使 用 的 束 是 CSV 格 式 : 


张 三 , 18, 80.9 
李 四 , 17, 67.5 


使 用 之 前 介绍 的 字符 流 ， 看 上 去 就 可 以 很 容易 处 理 CSV 文 件 ， 按 
行 读 了 到， 对 每 一 行 ， 使 用 String.split 进 行 分 隔 即 可 。 但 其 实 CSV 有 一 些 
复杂 的 地 方 ， 最 重要 的 是 : 

字段 内 容 中 包含 分 隔 符 怎么 办 ? 

.字段 内 容 中 包含 换行 符 怎 么 办 ? 

对 于 这 些 问 题 ，CSV 有 一 个 参考 标准 : RFC-4180 


https:/tools.ietf.org/html/rfc4180 ) ， 但 实践 中 不 同 程序 往往 有 其 他 处 
理 方式 ， 所 邓 的 是 ， 处 理 方 式 大 体 类 似 ， 大 概 有 以 下 两 种 处 理 方 式 。 


1) 使 用 引用 符号 比如 "， 在 字段 内 容 两 边 加 上 "， 如 采 内 容 中 包 
含 "本 映 ， 则 使 用 两 个 "。 


2) 使 用 转 义 字符 ， 篆 用 的 古 \， 如 果 内 容 中 包 仿 \， 则 使 用 两 个 \。 
比如 ， 如 末 字 段 内 容 有 两 行 ， 内 容 为 : 


hello, world \ abc 
" 老 马 " 


使 用 第 一 种 方式 ， 内 容 会 变 为 : 


"hello, world \ abc 


使 用 第 二 种 方式 ， 内 容 会 变 为 : 


hello\，world \\、abc\n" 老 马 " 


CSV 还 有 其 他 一 些 细节 ， 不 同 程序 的 处 理 方 式 也 不 一 样 ， 比 如 ; 


.怎么 表示 null 值 
. 空 行 和 字段 之 间 的 空格 怎么 处 理 
.怎么 表示 注释 


对 于 以 上 这 些 复 杂 问 题 ， 使 用 简单 的 字符 流 就 难以 处 理 了 。 有 一 
个 第 三 方 类 库 : Apache Commons CSV， 对 处 理 CSV 提 供 了 民 好 的 支 
持 ， 它 的 官网 地 址 是 http://commons.apache.org/proper/commons- 
csv/index.html 。 本 节 使 用 其 1.4 版 本 ， 人 简要 介绍 其 用 法 。Apache 
Commons CSV 中 有 一 个 重要 的 类 CSVFormat， 它 表示 CSV 格 式 ， 它 有 
很 多 方法 以 定义 具体 的 CSV 格 式 ， 如 : 


// 定 义 分 隅 符 
public CSVFormat withDelimiter(final char delimiter) 
// 定 义 引 号 符 
public CSVFormat withQuote(final char quotechar ) 


// 定 义 转 义 符 

public CSVFormat withEscape(final char escape) 

// 定 义 值 为 nu1l1 的 对 象 对 应 的 字符 串 值 

public CSVFormat withNullstring(final String nullstring) 

// 定 义 记 录 之 间 的 分 隔 符 

public CSVFormat withRecordSeparator(final char recordSeparator) 

// 定 义 是 否 忽略 字段 之 间 的 空 

public CSVFormat withIgnoreSurroundingSpaces( 
final boolean ignoreSurroundingSpaces) 


比如 ， 如 果 CSV 格 式 使 用 分 号 ;， 作 为 分 隅 符 ， 使 用 "作为 引号 符 ， 
忽略 字段 之 间 的 空 日 ， 那 么 CSVFormat 可 以 如 
下 创建 : 


CSVFormat format = CSVFormat.newFormat(';') 
.WithQuote('"').withNullstring("N/A") 
.WithIgnoreSurroundingSpaces(true); 


除了 自 定义 CSVFormat，CSVFormat 类 中 也 定义 了 一 些 预定 义 的 格 
式 ， 如 CSVFormat.DEFAULT, CSVFormat.RFC4180。 


CSVFormat 有 一 个 方法 ， 可 以 分 析 字 符 流 : 


public CSVParser parse(final Reader in) throws IOException 


返回 值 类 型 为 CSVParser， 它 有 如 下 方法 获取 记录 信息 : 


public Iterator<CSVRecord> iterator() 
public List<CSVRecord> getRecords() throws IOException 
public long getRecordNumber() 


CSVRecord 表 示 一 条 记录 ， 它 有 如 下 方法 获取 每 个 字段 的 信息 : 


// 根 据 字段 列 索 引 获 取 值 ， 索 引 从 0 开始 
public String get(final int i) 
// 根 据 列 名 获取 值 

public String get(final String name) 
// 字 段 个 数 

public int size() 

// 字 段 的 迭代 器 


public Iterator<String> iterator() 


分 析 CSV 文 件 的 基本 代码 如 下 所 示 : 


CSVFormat format = CSVFormat.newFormat(';') 
.WithQuote('"').withNullstring("N/A") 
.WithIgnoreSurroundingSpaces(true); 

Reader reader = new FileReader("student.csv"); 

try{ 

for(CSVRecord record : format.parse(reader))t{ 
int fieldNum = record.size(); 
for(int i=0; i<fieldNum; i++){ 
System.out.print(record.get(i)+" "); 
} 


System.out.println(); 


} 
}finally{ 

reader .close( ); 
} 


除了 分 析 CSV 文 件 ，Apache Commons CSV 也 可 以 写 CSV 文 件 ， 
一 个 CSVPrinter， 它 有 很 多 打印 方法 ， 比 如 : 


// 输 出 一 条 记录 ， 参 数 可 变 ， 每 个 参数 是 一 个 字段 值 

public void printRecord(final Object... values) throws IOException 
// 输 出 一 条 记录 

public void printRecord(final Iterable<?> values) throws IOException 


代码 示例 : 


CSVPrinter out = new CSVPrinter(new Filewriter("student.csv"), 
CSVFormat ,DEFAULT ) ， 

out .printRecord(" 老 马 "，18， "看 电影 ， 

out .printRecord(" 小 马 "，16,， "乐高 ; 赛 

out.close( ); 


书 , 听 音 乐 ")， 


2 


计 剖 


输出 文件 student.csv 中 的 内 容 为 : 


" 老 马 ", 18, "看 电影 , 看 书 , 听 音 乐 " 
"小 马 " ,16, 乐高 ;赛车 ， 


14.1.3 Excel 


Excel 主 要 有 了 两 种 格式 ,扩展 名 分 别 为 .xls 和 .xlsx。.xlsx 是 Office 
2007 以 后 的 Excel 文 件 的 默认 扩展 名 。Java 中 处 理 Excel 文 件 及 其 他 微软 
文档 广泛 使 用 POI 类 库 ， 其 家 网 是 http:/poi.apache.org/ 。 本 世人 使 用 其 
3.15 版 本 ， 简 要 介绍 其 用 法 。 使 用 POI 人 处 理 Excel 文 件 ， 有 如 下 主要 类 。 


1) Workbook: 表示 一 个 Excel 文 件 对 象 ， 它 是 一 个 接口 ， 有 两 个 
主要 类 HSSFWork-book 和 XSSFWorkbook， 前 者 对 应 ,xls 格式 ， 后 者 对 
应 .xlsx 格 式 。 

2) Sheet: 表示 一 个 工作 表 。 

3) Row: 表示 一 行 。 

4) Cell: 表示 一 个 单元 格 。 


比如 ， 保 存 学 生 列 表 到 student.xls， 代 码 可 以 为 : 


public static void saveAsExcel(List<Student> list) throws IOException { 

Workbook wb = new HSSFWorkbook(); 

Sheet sheet = wb.createSheet(); 

for(int i = 0; i < list.size(); i++) { 
Student student = list.get(i); 
Row row = sheet.createRow(i); 
row.createCell(0).setcellValue(student.getName()); 
row.createCell(1).setCcellValue(student .getAge()); 
row.createCell(2).setCcellVvalue(student.getScore()); 


OutputStream out = new FileOutputStream("student.xls"); 
wb .write(out); 


out.close( ); 
wb.close( ); 


如 有 果 要 保存 为 .xlsx 格 式 ， 只 需要 替换 第 一 行为 : 


Workbook wb = new XSSFWorkbook() 


使 用 POI 也 可 以 方便 的 解析 Excel 文 件 ， 使 用 WorkbookFactory 的 
create 方 法 即 可 ， 如 下 所 示 : 


public static List<Student> readAsExcel() throws Exception { 
Workbook wb = WorkbookFactory.create(new File("student.x]ls")); 
List<Student> list = new ArrayList<Student>(); 


for(Sheet Sheet : wb){ 
for(Row row : Sheet){ 
String name = row.getCell(0).getstringCellvalue(); 
int age = (int)row.getCell(1).getNumericCellValue(); 
double Score = row.getCell(2).getNumericCellValue(); 
list.add(new Student(name, age, score)); 


wb.close( ); 
return list,; 


以 上 只 是 介绍 了 基本 用 法 ， 如 果 需 要 更 多 信息 ， 如 配置 单元 格 的 
格式 、 颜 色 、 字 体 ， 可 参看 http://poi.apache.org/spreadsheet/quick- 
guide.html 。 


14.1.4 HIML 


HTML 是 网 页 的 格式 ， 如 果 不 熟 悉 ， 可 以 参看 
http://www.w3school.com.cn/html/html_intro.asp 。 在 日 常 工 作 中 ， 可 能 
需要 分 析 HTML 页 面 ， 抽 取 其 中 感 兴 趣 的 信息 。 有 很 多 HTML 分 析 器 ， 
我 们 简要 介绍 一 种 :jsoup， 其 官网 地 址 为 https://jsoup.org/ 。 本 太 使 用 
其 1.10.2 版 本 。 我 们 通过 一 个 人 简单 例子 来 看 jsoup 的 使 用 ， 我 们 要 分 析 的 
网 页 地 址 是 http://www.cnblogs.com/swiftma/p/5631311.html 。 浏览 姨 中 
看 起 来 的 样子 (部 分 截图 ) 如 图 14-1 所 示 。 
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图 14-1 HTML 网 页 示例 
将 网 页 保存 下 来 ， 其 HTML 代码 (部 分 截图 ) 看 上 去 如 图 14-2 所 


</ul> 
<div class="blogSstats"> 


<div id="blog stats"> 
<span id="stats post count"> 随 笔 - 62gnbsp; </span> 
<span id="stats_article count"> 文 章 - 0&nbsp; </span> 
<span id="stats-comment count"> 评 论 - 171</span> 
</div> 


</div><!--end: blogStats --> 
</div><!--end: navigator 博客 导航 栏 --> 
</div><!--end: header 头 部 --> 


57 口 <div id="main"> 
58] <div id="mainContent"> 
59 口 <div class="forFlow"> 
60 
61 <div id="post detail"> 
62 <!--done--> 
63D <div id="topics"> 
<div class="post"> 
<hl class="postTitle"> 
<a id="cb post title url" class="postTitle2" 
href="http://www.cnblogs.com/swiftma/p/5631311.html"> 计 算 机 程序 的 思维 逻辑 - 文章 列表 
</a> 
</h1l> 
<div class="clear"></div> 
<div class="postBody"> 
<div id="cnblogs post body"><p><a id="post title link 5396551" 
href="http://www.cnblogs.com/swiftma/p/5396551.html"> 计 算 机 程序 的 思维 逻辑 (1) - 
数据 和 变量 </a></p> 
<p><a id="post title link 5399315" 
cx (2) - 赋值 </a> 
</p> 
<p><a id="post title link 5405417" 
OE OT EE OG ea (3) - 基本 运算 </a> 
</p> 


图 14-2 ”HTML 网 页 代码 示例 


假定 我 们 要 抽取 网 页 主题 内 容 中 每 篇 文章 的 标题 和 链接 ， 怎 么 实 
现 呢 ?jsoup 支 持 使 用 CSS 选 择 器 语法 查找 元 素 ， 如 果 不 了 解 CSS 选 择 


厂 ， 可 参看 http://www.w3school.com.cn/cssref/css_selectors.asp 。 


定位 文章 列表 的 CSS 选 择 器 可 以 是 : 


##cnblogs_post_body p a 


我 们 来 看 代码 (假定 文件 为 articles.html) 


Document doc = Jsoup.parse(new File("articles.html"), "UTF-8"); 
Elements elements = doc.select("#cnblogs_ post_ body p a"); 
for(Element e : elements){ 

String title = e.text(); 

String href = e.attr("href"); 

System.out.printiln(title+", "+href); 


输出 为 (部 分 ) 


计算 机 程序 的 思维 逻辑 (1) - 数据 和 变量 ，http://www.cnblogs.com/swiftma/p/5396551.html 


= 


计算 机 程序 的 思维 逻辑 (2) - 赋值 ，http://www.cnblogs.com/swiftma/p/5399315.html 


jsoup 也 可 以 直接 连接 URL 进 行 分 析 ， 比 如 ， 上 面 代码 的 第 一 行 可 
以 奉 换 为 : 


String Url = "http://www.cnblogs.com/swiftma/p/5631311.html",; 
Document doc = Jsoup.connect(url1).get(); 


关于 jsoup 的 更 多 用 法 ， 请 参看 其 官网 。 
14.1.5 压缩 文件 


压缩 文件 有 多 种 格式 ，Java SDK 文 持 两 种 : gzip 和 zip，gzip 只 能 压 
缩 一 个 文件 ， 而 zip 文 件 中 可 以 包含 多 个 文件 。 下 面 介绍 Java API 中 的 基 
本 用 法 ， 如 果 需 要 更 多 格式 ， 可 以 考虑 Apache Commons Compress， 网 


址 为 http://commons.apache.org/proper/commons-compress/ ° 


先 来 看 gzip， 有 两 个 主要 的 类 : 


Java,util1,.zip.GZIPOutputStream 
java.util.zip.GZIPINputStream 


它们 分 别 是 OutputStream 和 InputStream 的 子 类 ， 都 是 装饰 类 ， 
GZIPOutputStream 加 到 已 有 的 流 上 ， 融 可 以 实现 压缩 ， 而 
GZIPImnputStream 加 到 已 有 的 渡 上 ， 束 可 以 实现 解压 缩 。 比 如 ， 压 缩 一 
个 文件 的 代码 可 以 为 : 


public static void gzip(String fileName) throws IOException { 
InputStream in = null; 
String gzipFileName = fileName + ".gz"; 
OutputStream out = null; 
try { 
in = new BufferedInputStream(new FileInputStream(fileName ) ) ， 
out = new GZIPOutputStream(new BufferedoutputStream( 
new FileOutputStream(gzipFileName))); 
copy(in, out); 


} finally { 
if(out != nul1) { 
out.close( ); 


} 
if(in != null) { 
in.close(); 


调用 的 copy 方 法 是 我 们 在 上 一 章 介绍 的 。 解 压缩 文件 的 代码 可 以 


public static void gunzip(String gzipFileName, String unzipFileName) 
throws IOException { 
InputStream in = null; 
OutputStream out = null; 
try { 
in = new GZIPInputStream(new BufferedInputStream( 
new FileInputStream(gzipFiIilLeName) ) )， 
out = new BufferedoutputStream(new FileOutputStream( 
unzipFileName)); 
copy(in, out); 
} finally { 
if(out != nul1) { 
out.close( ); 


} 

if(in != null) { 
in.close(); 

} 


} 
} 


Zip 文件 文 持 一 个 压缩 文件 中 包 侣 多 个 文件 ，Java API 中 主要 的 类 


冯 


java.util.zip.ZipOutputStream 
java.util.zip.ZipInputStream 


它们 也 分 别 是 OutputStream 和 InputStream 的 子 类 ， 也 都 是 装饰 类 ， 
但 不 能 像 GZIP-OutputStreamyVGZIPInputStream 那 样 简单 使 用 。 


ZipOutputStream 可 以 写 入 多 个 文件 ， 它 有 一 个 重要 方法 ; 


public void putNextEntry(ZipEntry e) throws IOException 


人 在 写 入 每 一 个 文件 前 ， 必 须要 先 调 用 该 方法 ， 表 未 准备 写 入 一 个 
压缩 条 目 ZipEntry， 每 个 压缩 条 目 有 个 名 称 ， 这 个 名 称 是 压缩 文件 的 相 
对 路 径 ， 如 果 名 称 以 字符 "结尾 ， 表 示 目 未 ， 它 的 构造 方法 是 : 


public ZipEntry(String name) 


我 们 看 一 段 代码 ， 压 缩 一 个 文件 或 一 个 目录 : 


public static void zip(File inFile, File zipFile) throws IOException { 
ZipOutputStream out = new ZipOutputStream(new BufferedoutputStream( 
new FileOutputStream(zipFile))); 
try { 
if(!inFile.exists()) { 
throw new FileNotFoundException(inFile.getAbsolutePpath()); 
} 


inFile = inFile.getCanonicalFile(); 

String rootPath = inFile.getParent(); 

if(!rootPpath.endswith(File.separator)) { 
rootPath += File.separator,; 


} 

addFileToZipOut(inFile, out, rootPath); 
} finally { 

out.close( ); 
} 


参数 inFile 表 示 和 输入， 可 以 是 普通 文件 或 目 未 ，zipFile 表 示 输 出 ， 
rootPath 表 示 父 目录 ， 用 于 计算 每 个 文件 的 相对 路 径 ， 主 要 调用 了 
addFileToZipOut 将 文件 加 入 到 ZipOutput-Stream 中 ， 代 三 为 : 


private static void addFileToZipOut(File file, ZipOutputStream out, 
String rootPath) throws IOException { 
String relativePath = file.getCcanonicalPath().substring( 
rootPath.1length( )); 
if(file.isFile()) { 
out .putNextEntry(new ZipEntry(relativePath ) ) ， 
InputStream in = new BufferedInputStream(new FileInputStream(file)); 
try { 
copy(in, out); 
} finally { 
in.close(); 


} 
} else { 
out.putNextEntry(new ZipEntry(relativePath + File.separator)); 
for(File f : file.listFiles()) { 
addFileToZipOut(f, out, rootPath),; 
} 


它 同 样 调用 了 copy 方 法 将 文件 内 容 写 入 ZipOutputStream， 对 于 目 
孙 ， 进 行 递归 调用 。 


ZipInputStream 用 于 解压 zip 文 件 ， 它 有 一 个 对 应 的 方法 ， 获 取 压 缩 


public ZipEntry getNextEntry() throws IOException 


如 有 果 返 回 值 为 null， 表 示 没 有 条 目 了 。 使 用 ZipInputStream 解 压 文 
件 ， 可 以 使 用 类 似 如 下 代码 : 


public static void unzip(File zipFile, String destDir) throws IOException f{ 
ZipInputStream zin = new ZipInputStream(new BufferedInputStream( 
new FileInputStream(zipFile))); 
if(!destDir.endswith(File.separator)) { 
destDir += File.separator,; 


} 
try { 
ZipEntry entry = zin.getNextEntry(); 
while(entry != null) { 
extractzZipEntry(entry, zin, destDir); 
entry = zin.getNextEntry(); 


} 
} finally { 
zin.close( ); 
} 


调用 extractZipEntry 处 理 每 个 压缩 条 目 ， 代 码 为 : 


private static void extractZzipEntry(ZipEntry entry，ZipInputStream zin, 
String destDir) throws IOException { 
if(!entry.isDirectory()) { 
File parent = new File(destDir + entry.getName()).getPparentrFile(); 
if(!parent.exists()) { 
parent.mkdirs(); 


} 
OutputStream entryout = new BufferedoutputStream( 
new FileOutputStream(destDir + entry.getName())); 
try { 
copy(zin, entryOut); 
} finally { 
entryOut.close(); 


} 
} else { 

new File(destDir + entry.getName()).mkdirs(); 
} 


至 此 ， 关 于 5 种 常见 文件 类 型 的 处 理 ， 属性 文件 、CSV、Excel、 
HTML 和 压缩 文件 ， 就 介绍 完了 。 人 完整 的 代码 在 github 上 ， 地 址 为 
https://github.com/swiftma/program-logic ， 位 于 包 shuo.laoma.file.c64 
下 。 


14.2 ”随机 读 写 文件 


我 们 先 介绍 RandomAccessFile 的 用 法 ， 然 后 介绍 怎么 利用 它 实现 
一 个 人 简单 的 键 值 对 数据 库 。 


14.2.1 用 法 
RandomAccessFile 有 如 下 构造 方法 : 


public RandomAccessFile(String name, String mode) 
throws FileNotFoundException 

public RandomAccessFile(File file, String mode) 
throws FileNotFoundException 


参数 name 和 file 容 易 理解 ， 表 示 文 件 路 径 和 File 对 象 ，mode 是 什么 
意思 呢 ? 它 表示 打开 模式 ， 可 以 有 4 个 取 值 。 


由 用 于 读 ， 
2) "rw": 用 于 读 和 写 。 


3) "rws": 和 "rw" 一 样 ， 用 于 读 和 写 ， 另 外 ， 它 要 求 文件 内 容 和 
元 数据 的 任何 更 新 都 同步 到 设备 上 。 

4) "rwd": 和 和 "rw" 一样 ， 用 于 读 和 写 ， 男 外 ， 它 要 求 文件 内 容 的 
任何 更 新 都 同步 到 设备 上 ， 和 "rws" 的 区 别 是 ， 元 数据 的 更 新 不 要 求 同 


步 。 


RandomAccessFile 虽 然 不 是 mputStream/OutputStream 的 子 类 ， 但 
它 也 有 类 似 于 读 写字 节 流 的 方法 。 男 外 ， 它 还 实现 了 
DataInput/DataOutput 接 口 。 这 些 方法 我 们 之 前 基本 都 介绍 过 ， 这 里 列 
举 部 分 方法 ， 以 增强 直观 感受 : 


// 读 一 个 字 节 ， 取 最 低 8 位 ，0 一 255 
public int read() throws IOException 
public int read(byte b[]) throws IOException 


public final int readInt() throws IOException 
public final void writeInt(int v) throws IOException 
public void write(byte b[]) throws IOException 


RandomAccessFile 还 有 另外 两 个 read 方 法 : 


public final void readFully(byte b[]) throws IOException 
public final void readFully(byte b[], int off, int len) throws IOException 


与 对 应 的 read 方 法 的 区 别 是 ， 它 们 可 以 确保 读 够 期 望 的 长 度 ， 如 
果 到 了 文件 结尾 也 没 读 够 ， 它 们 会 抛 出 EOFException 异 常 。 


RandomAccessFile 内 部 有 一 个 文件 指针 ， 指 向 当前 读 写 的 位 置 ， 
各 种 read/write 探 作 都 会 目 动 更 新 该 指针 。 与 流 不 同 的 是 ， 
RandomAccessFile 可 以 获取 该 指针 ， 也 可 以 更 改 该 指针 ， 相 关 方 法 
AXE: 


// 获 取 当 前 文件 指针 
public native long getFilePointer() throws IOException 
// 更 改 当前 文件 指针 到 pos 

public native void seek(long pos) throws IOException 


RandomAccessFile 是 通过 本 地 方法 ， 最 终 调用 操作 系统 的 API 来 实 
现 文件 指针 调整 的 。 


InputStream 有 一 个 skip 方 法 ， 可 以 跳 过 输入 流 中 n 个 他方， 默认 情 
况 下 ， 它 是 通过 实际 读 取 n 个 字 广 实现 的 。RandomAccessFile 有 一 个 类 
似 方 法 ， 不 过 它 是 通过 更 改 文件 指针 实现 的 : 


public int skipBytes(int n) throws IOException 


OO OE 返回 文件 字 太 数 ， 方 
法 为 ; 


public native long length() throws IOException 


它 还 可 以 直接 修改 文件 长 度 ， 方 法 为 : 


public native void setLength(long newLength) throws IOException 


如 果 当 前 文件 的 长 度 小 于 newLength， 则 文件 会 扩展 ， 扩 展 部 分 的 
内 容 未 定义 。 如 果 当 前 文件 的 长 上 度 大 于 newLength， 则 文件 会 收缩 ， 多 
出 的 部 分 会 截取 ， 如 果 当 前 文件 指针 比 newLength 大 ， 则 调用 后 会 变 为 


newLength。 


RandomAccessFile 中 有 如 下 方法 ， 需 要 注意 一 下 : 


public final void writeBytes(String s) throws IOException 
public final String readLine() throws IOException 


看 上 去 ，writeBytes 方 法 可 以 直接 写 入 字符 串 ， 而 readLine 方 法 可 
以 按 行 读 入 字符 串 ， 实 际 上 ， 这 两 个 方法 都 是 有 问题 的 ， 它 们 都 没有 
编码 的 概念 ， 都 假定 一 个 字 广 束 代 表 一 个 字符 ， 这 对 于 中 文 显然 是 不 
成 立 的 ， 所 以 ， 应 避免 使 用 这 两 个 方法 。 


14.2.2 ”设计 一 个 键 值 数据 库 BasicDB 


在 日 常 的 一 般 文件 读 写 中 ， 使 用 流 束 可 以 了 ， 但 在 一 些 系 统 程序 
J Ls ，RandomAccessFile 因 为 更 接近 操作 系统 ， 更 为 方 
[高 效 。 


下 面 ， 我 们 来 看 怎么 利用 RandomAccessFile 实 现 一 个 简单 的 键 值 
数据 库 ， 我 们 称 之 为 BasicDB“。 我 们 从 功能 、 接 口 、 使 用 和 设计 等 几 
个 方面 进行 介绍 ， 完 整 的 代码 在 github 上 ， 地 址 为 
https://github.com/swiftma/program-logic ， 位 于 包 shuo.laoma.file.c60 


1. 功 能 


BasicDB 提 供 的 接口 类 似 于 Map 接 口 ， 可 以 按键 保存 、 查 找 、 删 
除 ， 但 数据 可 以 持久 化 保存 到 文件 上 上。 此外， 不 像 
HashMap/TreeMap， 它 们 将 所 有 数据 保存 在 内 存 ，BasicDB 只 把 元 数据 
如 索引 信息 保存 在 内 存 ， 值 的 数据 保存 在 文件 上 。 相 比 
HashMap/TreeMap，BasicDB 的 内 存 消耗 可 以 大 大 降低 ， 存 储 的 键 值 对 


个 数 大 大 提高 ， 尤 其 当 值 数 据 比较 大 的 时 候 。BasicDB 通 过 索引 ， 以 
及 RandomAccessFile 的 随机 读 写 功能 保证 效率 。 


2. 接 口 
对 外 ，BasicDB 提 供 的 构造 方法 是 : 


public BasicDB(String path, String name) throws IOException 


path 表 示 数 据 库 文件 所 在 的 目录 ， 该 目录 必须 已 存在 。name 表 示 
数据 库 的 名 称 ，BasicDB 会 使 用 以 name 开 头 的 两 个 文件 ， 一 个 存储 元 
数据 ， 扩 展 名 是 .meta， 一 个 存储 键 值 对 中 的 值 数据 ， 扩 展 名 是 .data。 
比如 ， 如 果 name 为 student， 则 两 个 文件 为 student.meta 和 student.data， 
这 两 个 文件 不 一 定 存 在 ， 如 果 不 存在 ， 则 创建 渐 的 数据 库 ， 如 果 已 存 
在 ， 则 加 载 已 有 的 数据 库 。 


BasicDB 提 供 的 公开 方法 有 : 


// 保 存 键 值 对 ， 键 为 String 类 型 ， 值 为 byte 数 组 

public void put(String key, byte[] value) throws IOException 
// 根 据 键 获取 值 ， 如 果 键 不 存在 ， 返 回 nu11 

public byte[] get(String key) throws IOException 

public void remove(String key) // 根 据 键 删除 

public void flush() throws IOException // 确 保 将 所 有 数据 保存 到 文件 
public void close() throws IOException // 关 闭 数据 库 


为 便于 实现 ， 我 们 假定 值 即 byte 数 组 的 长 度 不 超过 1020， 如 果 超 
过 ， 会 抛 出 异常 ， 当 然 ， 这 个 长 度 在 代码 中 可 以 调整 。 在 调用 put 和 
remove 后 ， 修 改 不 会 马上 反映 到 文件 中 ， 如 果 需 要 确保 保存 到 文件 
中 ， 需 要 调用 flush 。 


3. 使 用 

在 BasicDB 中 ， 我 们 设计 的 值 为 byte 数 组 ， 这 看 上 去 是 一 个 限制 ， 
不 便 使 用 ， 我 们 主要 是 为 了 人 简化， 而 且 任何 数据 都 可 以 转化 为 byte 数 
组 保存 。 对 于 字符 串 ， 可 以 使 用 getBytes () 方法 ， 对 于 对 象 ， 可 以 使 
用 之 前 介绍 的 流转 换 为 byte 数 组 。 


比如 ， 保 存 一 些 学 生 信息 到 数据 库 ， 代 码 可 以 为 : 


private static byte[] toBytes(Student student ) throws IOException { 
ByteArrayOutputStream bout = new ByteArrayOutputStream( ) ， 
DataOutputStream dout = new Data0utputStream(bout ) ， 
dout ,writeUTF(student .getName() ) ， 
dout .writeInt(student.getAge( )); 
dout .writeDouble(student.getScore()); 
return bout.toByteArray(); 


public static void saveStudents(Map<String, Student> students) 
throws IOEXception { 
BasicDB db = new BasicDB("./", "students"),; 
for(Map.Entry<String, Student> kv : Students,entrySet()) { 
db.put(kv.getkey(), toBytes(kv.getVvalue())); 


db.close(); 


保存 学 生 信 息 到 当前 目录 下 的 students 数 据 库 ，toBytes 方 法 将 
Student 转 换 为 了 字 节 。14.3 贡 会 介绍 序列 化 ， 使 用 序列 化 ，toBytes 方 
法 的 代码 可 以 更 为 倘 消 。 


i 

我 们 采用 如 下 简单 的 设计 。 

1) 将 键 值 对 分 为 两 部 分 ， 值 保存 在 单独 的 .data 文 件 中 ， 值 在 .data 
文件 中 的 位 置 和 键 称 为 索引 ， 索 引 保 存在 .meta 文 件 中 。 


2) 在 .data 文 件 中 ， 每 个 值 占用 的 空间 固定 ， 固 定 长 度 为 1024， 前 
4 个 字 市 表示 实际 长 度 ， 然 后 是 实际 内 容 ， 实 际 长 度 不 够 1020 的 ， 后 面 
是 补 日 字 节 0。 


3) 索引 信息 既 保存 在 .meta 文 件 中 ， 也 保存 在 内 存 中 ， 在 初始 化 
a 对 索引 的 更 新 不 立即 更 新 文件 ， 调 用 flush 方 法 才 
于 o 


4) 删除 键 值 对 不 修改 .data 文 件 ， 但 会 从 索引 中 删除 并 记录 空白 空 
间 ， 下 次 添加 键 值 对 的 时 候 会 重用 空白 空间 ， 所 有 的 空白 空间 也 记录 
到 .meta 文 件 中 。 


我 们 暂 不 考虑 由 于 并 发 访问 、 异 彰 关 闭 等 引起 的 一 致 性 问题 。 这 
个 设计 虽然 是 比较 粗糙 的 ， 但 可 以 演示 一 些 基 本 概念 。 


14.2.3 ”BasicDB 的 实现 


下 面 ， 我 们 来 看 实现 代码 ， 先 来 看 内 部 组 成 和 构造 方法 ， 
一 些 主要 万 法 的 实现 。 


BasicDB 定 义 了 如 下 静态 变量 : 


private static final int MAX_DATA_LENGTH = 1020; 
// 补 白字 
private static final byte[] ZERO_BYTES = new byte[MAX_DATA_LENGTH] ， 


// 数 据 文件 扩展 名 

private Static final String AT SUFFIX = ".data"; 
// 元 数据 文件 扩展 名 ， 包 括 索引 和 空白 空间 数据 

private Static final String META_ SUFFIX = ".meta"; 


内 存 中 表示 索引 和 空白 空间 的 数据 结构 是 : 


Map<String，Long> indexMap; // 索 引信 息 ， 键 -> 值 在 ,data 文 件 中 的 位 置 
Queue<Long> gaps; // 空 白 空 间 ， 值 为 在 .data 文 件 中 的 位 


表示 文件 的 数据 结构 是 : 


RandomAccessFile db; // 值 数据 文件 
File metaFile; /7 元 数据 文件 


构造 方法 的 代码 为 : 


public BasicDB(String path, String name) throws IOException{ 

File dataFile = new File(path + name + DATA_SUFFIX); 
metaFile = new File(path + name + META_SUFFIX) ， 
db = new RandomAccessFile(dataFile, "rw"); 
if(metaFile.exists()){ 

loadMeta( ); 
}elsef{ 

indexMap = new HashMap<>(); 

gaps = new ArrayDeque<>(); 


元 数据 文件 存在 时 ， 会 调用 loadMeta 将 元 数据 加 载 到 


先 假定 不 存在 ， 先 来 看 其 他 代码 。 保 存 键 值 对 的 方法 是 put， 


我 们 


public void put(String key, byte[] value) throws IOException{ 
Long index = indexMap.get(key); 
if(index==null1){ 
index = nextAvailablePos(); 
indexMap.put(key, index); 


writeData(index, value); 


} 


先 通过 有 索引 查找 键 是 否 存 在 ， 如 果 不 存 在 ， 调 用 nextAvailablePos 
方法 为 值 找 一 个 存储 位 置 ， 并 将 键 和 存储 位 置 保存 到 索引 中 ， 最 后 ， 
调用 writeData 方 法 将 值 写 到 数据 文件 中 。 


nextAvailablePos 的 代码 是 : 


private long nextAvailablePos() throws IOException{ 
if(!gaps.isEmpty())t{ 
return gaps.poll(); 
}elsef{ 
return db.length(); 


它 首 先 查 找 空白 空间 ， 如 果 有 ， 则 重用 ， 否 则 定位 到 文件 末尾 。 
writeData 方 法 实际 写 值 数 据 ， 它 的 代码 是 : 


private void writeData(long pos，byte[] data) throws IOException { 
if(data.length > MAX_DATA LENGTH) { 
throw new IllegalArgumentException("maximum allowed length is " 
+ MAX_DATA LENGTH + ", data length is " + data.length); 


db.seek(pos); 

db.writeInt(data.1length); 

db.write(data),; 

db .write(ZERO_BYTES, ©0, MAX_DATA _ LENGTH - data.length); 


它 移 检查 长 度 ， 长 度 满足 的 情况 下 ， 定 位 到 指定 位 置 ， 写 实际 数 
据 的 长 度 、 写 内 容 、 最 后 补 日 。 


可 以 看 出 ， 在 这 个 实现 中 ， 索 引信 息 和 空 0 3 间 信 息 并 没有 实时 
0 要 保存 ， 需 要 调用 flush 方 法 ， 答 会 我 们 再 看 这 个 方 
法 。 


根据 键 获取 值 的 方法 是 get， 其 代码 为 : 


public byte[] get(String key) throws IOEXception{ 
Long index = indexMap .get(key) 
if(index!=null){ 
return getData(index); 


return null; 
站 如 果 键 存在 ， 束 调用 getData 方 法 获取 数据 。getData 方 法 的 代码 


private byte[] getData(long pos) throws IOException{ 
db.seek(pos); 
int length = db.readInt(); 
byte[] data = new byte[length]; 
db.readFully(data); 
return data; 


代码 也 很 简单 ， 定 位 到 指定 位 置 ， 读 取 实 际 长 度 ， 然 后 调用 
readFully 方 法 读 够 内 容 。 


删除 键 值 对 的 方法 是 remove， 其 代码 为 : 


public void remove(String key)t{ 
Long index = indexMap.remove(key); 
if(index!=null1){ 
gaps.offer(index); 


从 索引 结构 中 删除 ， 并 添加 到 空 日 空间 队列 中 。 
同步 元 数据 的 方法 是 flush () ， 其 代码 为 : 


public void flush() throws IOException{ 
saveMeta( )，; 
db.getFD().sync(); 

} 


回顾 一 下 ，getFD 方 法 会 返回 文件 描述 符 ， 其 sync 方 法 会 确保 文件 
内 容 保存 到 设备 上 ，saveMeta 方 法 的 代码 为 : 


private void SaveMeta( ) throws IOExceptiont{ 
Data0utputStream out = new Data0utputStream( 
new BufferedoutputStream(new FileOutputStream(metaFile))); 

try{ 

SaveIndex(out ) ， 

SaveGaps(out ) ， 
}finally{ 

out.close( ); 


索引 信息 和 至 日 空间 保存 在 一 个 文件 中 ，saveIndex 保 存 索 引信 
思 ， 代 码 为 : 


private void SaveIndex(Data0utputStream out) throws IOException{ 
out .writeInt(indexMap.Size())， 
for(Map.Entry<String, Long> entry : indexMap ,entrySet()){ 
out ,writeUTF(entry ,getKey() ) 
out .writeLong(entry.getValue() )， 
} 
} 


先 保存 键 值 对 个 数 ， 然 后 针对 每 条 索引 信息 ， 保 存 键 及 值 在 .data 
及 件 中 网 亿 站 3 


saveGaps 方 法 保存 空白 空间 信息 ， 代 但 为 : 


private void saveGaps(DataOutputStream out) throws IOException{ 
out .writeInt(gaps.size( )); 
for(Long pos : gaps){ 
out .writeLong(pos); 
} 


} 


也 是 先 保存 长 度 ， 然 后 保存 每 条 空 日 衬 间 信息 。 


我 们 使 用 了 之 前 介绍 的 流 来 保存 ， 这 些 代码 比较 烦琐 ， 如 果 使 用 
后 续 介 绍 的 序列 化 ， 代 码 会 更 为 简 清 。 


在 构造 方法 中 ， 我 们 提 到 了 1loadMeta 方 法 ， 它 是 saveMeta 的 逆 操 
作 ， 代 码 为 : 


private void loadMeta() throws IOExceptiont{ 
DataInputStream in = new DataInputStream( 
new BufferedInputStream(new FileInputStream(metaFile))); 

try{ 

loadIndex(in); 

loadGaps(in); 
}finally{ 

in.close(); 
} 


loadIndex 加 载 索 引 ， 代 码 为 : 


private void loadIndex(DataInputStream in) throws IOException{ 
int size = in.readInt(); 
indexMap = new HashMap<String, Long>((int) (size / 0.75f) + 1, 0.75f); 
for(int i=0; i<size; I++){ 
String key = in.readUTF(); 
long index = in.readLong(); 
indexMap.put(key, index); 
} 


lo0adGaps 加 载 空 日 空间 ， 代 码 为 : 


private void loadGaps(DataInputStream in) throws IOException{ 
int Size = in.readInt(); 
gaps = new ArrayDeque<>(size); 
for(int i=0; i<size; I++){ 
long index = in.readLong(); 
gaps.add(index); 


数据 库 关 闭 的 代码 为 : 


public void close() throws IOException{ 
flush(); 


db ,close(); 


就 是 同步 数据 ， 并 关闭 数据 文件 。 
14.24 ”小结 


本 市 介绍 了 RandomAccessFile 的 用 法 ， 它 可 以 随机 读 写 ， 更 为 接 
近 控 作 系 统 的 API， 在 实现 一 些 系 统 程 序 时 ， 它 比 流 要 更 为 方便 高 
效 。 利 用 RandomAccessFile， 我 们 实现 了 一 个 非常 徐 单 的 键 值 对 数据 
库 ， 我 们 演示 了 这 个 数据 库 的 用 法 、 接 口 、 设 计 和 实现 代码 。 在 这 个 
例子 中 ， 我 们 同时 展示 了 之 前 介绍 的 容 妖 和 流 的 一 些 用 法 。 


这 个 数据 库 虽 然 简 单 粗 糙 ， 但 也 具备 了 一 些 优 展 特点 ， 比 如 占用 
的 内 存 空 间 比 较 小 ， 可 以 存储 大 量 键 值 对 ， 可 以 根据 键 高 效 访问 值 


14.3 内存 映射 文件 


本 市 介绍 内 存 映 射 文件 ， 内 存 映 里 文 件 不 是 Java 引 入 的 概念 ， 而 是 
操作 系统 提供 的 一 种 功能 ， 大 部 分 操作 系统 都 支持 。 我 们 先 来 介绍 内 
存 映射 文件 的 基本 概念 ， 它 是 什么 ， 能 解决 什么 问题 ， 然 后 介绍 如 何 
在 Java 中 使 用 。 我 们 会 设计 和 实现 一 个 简单 的 、 持 久 化 的 、 跨 程序 的 消 
居 队 列 来 演示 内 存 映射 文件 的 应 用 。 


14.3.1 基本 概念 


所 谓 内 存 映射 文件 ， 束 是 将 文件 映射 到 内 存 ， 文 件 对 应 于 内 存 中 
的 一 个 字 市 数组 ， 对 文件 的 操作 变 为 对 这 个 字 太 数组 的 操作 ， 而 字 市 
数组 的 操作 直接 映射 到 文件 上 。 这 种 映射 可 以 是 映 味 文件 全 部 区 域 ， 
也 可 以 是 只 映射 一 部 分 区 域 。 


不 过 ， 这 种 映射 是 操作 系统 提供 的 一 种 假象 ， 文 件 一 般 不 会 马上 
加 载 到 内 存 ， 操 作 系 统 只 是 记 杂 下 了 这 回 事 ， 当 实际 发 生 读 写 时 ， 才 
会 按 需 加 载 。 操 作 系 统一 般 是 按 页 加 载 的 ， 页 可 以 理解 为 束 是 一 块 ， 
页 的 大 小 与 操作 系统 和 硬件 相关 ， 典 型 的 配置 可 能 羡 4K、8K 等 ， 当 操 
ee 
子 。 


这 种 按 需 加 载 的 方式 ， 使 得 内 存 映射 文件 可 以 方便 高 效 地 处 理 非 
常 大 的 文件 ， 内 存放 不 下 整个 文件 也 不 要 紧 ， 操 作 系统 会 自动 进行 处 
ee 
内存 释放 。 


在 应 用 程序 写 的 时 候 ， 它 写 的 是 内 存 中 的 字 节 数组 ， 这 个 内 容 什 
么 时 候 同 步 到 文件 上 呢 ? 这 个 时 机 是 不 确定 的 ， 由 操作 系统 决定 ， 不 
过 ， 只 要 操作 系统 不 朋 并 ， 操 作 系 统 会 保证 同步 到 文件 上 ， 即 使 映射 
这 个 文件 的 应 用 程序 已 经 退出 了 。 


在 一 般 的 文件 读 写 中 ， 会 有 两 次 数据 复制 ， 一 次 是 从 硬盘 复制 到 
操作 系统 内 核 ， 另 一 次 是 从 操作 系统 内 核 复制 到 用 户 态 的 应 用 程序 。 
而 在 内 存 有 映 射 文件 中 ， 一 般 情 况 下 ， 只 有 一 次 复制 ， 且 内 存 分 配 在 操 


作 系 统 内 核 ， 应 用 程序 访问 的 束 是 操作 系统 的 内 核 内 存 空间 ， 这 显然 
要 比 癌 通 的 读 写 效率 更 局。 


内 存 映 射 文件 的 另 一 个 重要 特点 是 : 它 可 以 被 多 个 不 同 的 应 用 程 
序 共享 ， 多 个 程序 可 以 映射 同一 个 文件 ， 映 射 到 同一 块 内 存 区 域 ， 一 
个 程序 对 内 存 的 修改 ， 可 以 让 其 他 程序 也 看 到 ， 这 使 得 它 特别 适合 
于 不 同 应 用 程序 之 间 的 通信 。 


站 
， 比 由 


a 


- 按 需 加 载 代 码 ， 只 有 当前 运行 的 代码 在 内 存 ， 其 他 暂时 用 不 到 的 
代码 还 在 硬盘。 


同时 启动 多 次 同一 个 可 执行 文件 ， 文 件 代 码 在 内 存 也 只 有 一 份 。 
不 同 应 用 程序 共享 的 动态 链接 库 代码 在 内 存 也 只 有 一 份 。 


内 存 映 射 文 件 也 有 局 限 性 。 比 如 ， 它 不 太 适 合 处 理 小 文件 ， 它 是 
按 页 分 配 内 存 的 ， 对 于 小 文件 ， 会 浪费 空间 ;， 另外， 映射 文件 要 消耗 
一 定 的 操作 系统 资源 ， 初 始 化 比较 慢 。 


简单 总 结 下 ， 对 于 一 般 的 文件 读 写 不 需要 使 用 内 存 映 射 文件 ， 但 
如 采 处 理 的 是 大 文件 ， 要 求 极 高 的 读 写 效 率 ， 比 如 数据 库 系 统 ， 或 者 
需要 在 不 同 程序 间 进 行 共享 和 通信 ， 那 束 可 以 考虑 内 存 映 射 文件 。 理 
解 了 内 存 映射 文件 的 基本 概念 ， 接 下 来 ， 我 们 看 怎么 在 Java 中 使 用 它 。 


14.3.2 用 法 


内 存 映 射 文件 需要 通过 FileInputStream/FileOutputStream 或 
RandomAccessFile， 它 们 都 有 一 个 方法 : 


public FileChannel getChannel() 


FileChannel 有 如 下 方法 : 


public MappedByteBuffer map(MapMode mode, long position, 
long size) throws IOException 


map 方 法 将 当前 文件 映射 到 和 内存， 映射 的 结果 束 是 一 个 
MappedByteBuffer 对 象 ， 它 代表 内 存 中 的 字 忆 数组 ， 竺 会 我 们 再 来 详细 
看 它 。map 有 三 个 参数 ，mode 表 示 有 映射 模式 ，positon 表 示 映 射 的 起 始 
位 置 ，size 表 示 长 度 。mode 有 三 个 取 值 : 


.MapMode.READ_ONLY: 只 读 。 


.MapMode.READ_WRITE: 既 读 也 写 。 


-MapMode.PRIVATE: 私有 模式 ， 更 改 不 反映 到 文件 ， 也 不 被 其 他 
程序 看 到 。 


这 个 模式 受 限 于 背后 的 流 或 RandomAccessFile， 比 如 ， 对 于 
FileInputStream， 或 者 RandomAccessFile 但 打开 模式 是 "r"，mode 就 不 能 
设 为 MapMode.READ_ WRITE， 否 则 会 抛 出 异常 。 如 果 映 射 的 区 域 超过 
了 现 有 文件 的 范围 ， 则 文件 会 目 动 扩展 ， 扩 展 出 的 区 域 字 下 内 容 为 0。 
映 喘 完 成 后 ， 文 件 就 可 以 天 闭 了 人， 后 续 对 文件 的 读 写 可 以 通过 Mapped- 
J 。 看 段 代码 ， 比 如 以 读 写 模式 映射 文件 "abc.dat"， 代 码 可 以 


RandomAccessFile file = new RandomAccessFile("abc.dat"™", "rw"); 
try 1 
MappedByteBuffer buf = file.getchannel() 
.map(MapMode .READ_WRITE, 0, file.length()); 

// 使 用 buf... 
} catch (IOEXception e) { 

e.printSstackTrace( ); 
}finally{ 

file.close( ); 
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怎么 来 使 用 MappedByteBuffer 呢 ? 它 是 ByteBuffer 的 子 类 ， 而 
ByteBuffer 是 Buffer 的 了 于 类 。ByteBuffer 和 Buffer 不 只 是 给 内 存 映 射 文件 
提供 的 ， 它 们 是 Java NIO 中 操作 数据 的 一 种 方式 ， 用 于 很 多 地 方 ， 方 法 
也 比较 多 ， 我 们 只 介绍 一 些 主要 相关 的 。 


ByteBuffer 可 以 位 单 理解 为 封 流 了 一 个 子 广 数组 ， 这 个 子 市 数组 的 
长 度 是 不 可 变 的 ， 在 内 存 映射 文件 中 ， 这 个 长 度 由 map 方 法 中 的 参数 


size 决 定 。ByteBuffer 有 一 个 基本 属性 position， 表 示 当 前 读 写 位 置 ， 这 
个 位 置 可 以 改变 ， 相 关 方 法 是 : 


public final int position() // 获 取 当 前 读 写 位 置 
public final Buffer position(int newPosition) // 修 改 当 前 读 写 位 


ByteBuffer 中 有 很 多 基于 当前 位 置 读 写 数据 的 方法 ， 部 分 方法 如 


public abstract byte get() // 从 当前 位 置 获取 一 个 字 节 
public ByteBuffer get(byte[] dst) // 从 当前 位 置 复 制 dst .length 长 度 的 字 节 到 dst 
public abstract int getInt() // 从 当前 位 置 读 取 一 个 int 
public final ByteBuffer put(byte[] src) // 将 字 节 数组 src 写 入 当前 位 
public abstract ByteBuffer putLong(long value); // 将 value 写 入 当前 位 


这 些 方法 在 读 写 后 ， 都 会 目 动 增加 position。 与 这 些 方法 相对 应 
的 ， 还 有 一 组 方法 ， 可 以 在 参数 中 直接 指定 position ， 比 如 : 


public abstract int getInt(int index) // 从 index 处 读 取 一 个 int 

public abstract double getDouble(int index) // 从 index 处 读 取 一 个 double 
// 在 index 处 写 入 一 个 double 

public abstract ByteBuffer putDouble(int index, double value) 

// 在 index 处 写 入 一 个 long 

public abstract ByteBuffer putLong(int index, long value) 


这 些 方法 在 读 写 时 ， 不 会 改变 当前 二 写 位 置 position 。 


MappedByteBuffer 目 己 还 定义 了 一 些 方法 : 


// 检 查 文件 内 容 是 否 真实 加 载 到 了 内 存 ， 这 个 值 是 一 个 参考 值 ， 不 一 定 精确 
public final boolean IsSLoaded() 
public final MappedByteBuffer load() // 尽 量 将 文件 内 容 加 载 到 内 存 

public final MappedByteBuffer force() // 将 对 内 存 的 修改 强制 同步 到 硬盘 上 


14.3.3 ”设计 一 个 消息 队列 BasicQueue 


了 解 了 内 存 肌 射 文件 的 用 法 ， 接 下 来 ， 我 们 来 看 怎么 用 它 设 计 和 
实现 一 个 位 单 的 消 居 队列， 我 们 称 之 为 BasicQueue。 本 小 市 先 介 绍 它 的 
功能 、 用 法 和 设计 ， 下 小 节 介 绍 它 的 具体 代码 。 完 整 的 代码 在 github 


上 ， 地 址 为 https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.file.c61 下 。 


1. 功 能 
es BO 长 度 固 定 ， 接 口 主要 是 出 
队 和 入 队 ， 与 之 前 介绍 的 容器 类 的 区 别 是 
1) 消息 持久 化 保存 在 文件 中 ， 重 启程 序 消息 不 会 丢失 。 


2) 可 以 供 不 同 的 程序 进行 协作 。 典 型 场景 是 ， 有 两 个 不 同 的 程 
序 ， 一 个 是 生产 者 男 一 个 十 消 费 首 ， 生 成 者 只 (将 消 轧 放 入 队列 ， 而 
请 履 者 只 从 队列 中 取消 县 ， 两 个 程序 通过 队列 进行 协作 。 这 种 协作 方 
式 更 灵活 ， 相 互 依赖 性 小 ， 古 一 种 和 常见 的 协作 方式 。 


BasicQueue 的 构造 方法 是 : 


public BasicQueue(String path, String queueName) throws IOException 


path 表 示 队 列 所 在 的 目录 ， 必 须 已 存在 ; queueName 表 示 队 列 名 ， 
BasicQueue 会 使 用 以 queueName 开 头 的 两 个 文件 来 保存 队列 信息 ， 一 个 
扩展 名 是 .data， 你 存 实际 的 消 轧 ， 男 一 个 扩展 名 是 .meta， 保存 元 数据 
如 果 这 两 个 文件 存在 ， 则 会 使 用 已 有 的 队列 ， 否 则 会 建立 新 队 
[| o 


BasicQueue 主 要 提供 出 队 和 入 队 两 个 方法 ， 如 下 所 示 : 


public void enqueue(byte[] data) throws IOException // 入 队 
public byte[] dequeue() throws IOException // 出 队 


与 上 市 介绍 的 BasicDB 类 似 ， 消 居 格 式 也 是 byte 数 组 。BasicQueue 
的 队列 长 度 是 有 限 的 ， 如 果 满 了 ， 调 用 enqueue 方 法 会 抛 出 异 彰 ; 消息 
的 最 大 长 度 也 是 有 限 的 ， 不 能 超过 1020， 如 果 超 了 ， 也 会 抛 出 异常 。 
如 果 队 列 为 空 ， 那 么 dequeue 方 法 返回 null。 


2. 用 法 示例 


BasicQueue 的 典型 用 法 是 生产 者 和 消费 者 之 间 的 协作 ， 我 们 来 看 下 
On 


public class Producer { 
public static void main(String[] args) throws InterruptedException { 


try { 
Eas coup dueue = new BasicQueue("./", "task"); 
int i = 0; 


Random rnd = new Random(); 

while(true) { 
String msg = new String("task " + (i++)); 
queue.enqueue(msg.getBytes("UTF-8")); 
System.out,.println("produce: " + msg); 
Thread.sleep(rnd.nextInt(1000)); 


} 
} catch (IOException e) { 
e.printSstackTrace( ); 


UU 予 从 队列 中 取消 轧 ， 如 有 果 队 列 为 裤 ， 也 随机 休 已 一 会 


public class Consumer { 
public static void main(String[] args) throws InterruptedException { 
try { 
BasicQueue queue = new BasicQueue("./", "task"); 
Random rnd = new Random(); 
while (true) { 
byte[] bytes = queue.dequeue(); 
if(bytes == null) { 
Thread.sleep(rnd.nextInt(1000)); 
continue; 


System.out.println("consume: " + new String(bytes, "UTF-8")); 


} 
} catch (IOException e) { 
e.printstackTrace( ); 


假定 这 两 个 程序 的 当前 目录 一 样 ， 它 们 会 使 用 同样 的 队列 "task" 。 
同时 运行 这 两 个 程序 ， 会 看 到 它们 的 输出 交替 出 现 。 


3 让 


我 们 采用 如 下 简单 方式 来 设计 BasicQueue。 


1) 使 用 两 个 文件 来 保存 消息 队列 : 一 个 为 数据 文件 ， 扩 展 
为 .data; 一 个 是 元 数据 文件 .meta。 


2) 在 .data 文 件 中 使 用 固定 长 度 存 储 每 条 信息 ， 长 度 为 1024， 前 4 
个 字 节 为 实际 长 度 ， 后 面 是 实际 内 容 ， 每 条 消息 的 最 大 长 度 不 能 超过 
1020 。 


3) 在 .meta 文 件 中 保存 队列 头 和 尾 ， 指 癌 .data 文 件 中 的 位 置 ， 初 始 
Ls 入 队 增 加 尾 ， 出 队 增加 头 ， 到 结尾 时 ， 再 从 0 开始 ， 模 拟 循环 
|| o 
4) 为 了 区 分 队列 满 和 空 的 状态 ， 始 终 留 一 个 位 置 不 保存 数据 ， 当 
队列 头 和 队列 尾 一 样 的 时 候 表 示 队 列 为 至 ， 当 队列 尾 的 下 一 个 位 置 是 
队列 尖 的 时 候 表 示 队 列 满 。 


BasicQueue 的 基本 设计 如 图 14-3 所 示 。 


昌 实 际 长 度 。 消息 最 大 长 度 
站 告 ) (1020 字 节 ) 


.data 数 据 文件 
图 14-3 ”BasicQueue 的 基本 设计 


为 简化 起 见 ， 我 们 畴 不 考虑 由 于 并 发 访问 等 引起 的 一 致 性 问题 。 
14.3.4 实现 消息 队列 


下 面 来 看 BasicQueue 的 具体 实现 代码 ， 包 括 常量 定义 、 内 部 组 成 、 
构造 方法 、 入 队 、 出 队 等 。 


BasicQueue 中 定义 了 如 下 利 量 ， 名 称 和 含义 如 下 : 


// 队 列 最 多 消息 个 数 ， 实 际 个 数 还 会 减 1 

private static final int MAX_MSG_NUM = 1020*1024; 
// 消 息 体 最 大 长 度 

private static final int MAX_MSG_ BODY_SIZE = 1020,; 
// 每 条 消息 占用 的 空间 
private static final int MSG_ SIZE = MAX_MSG_ BODY_SIZE + 4; 

// 队 列 消息 体 数 据 文 件 大 小 

private static final int DATA_FILE_ SIZE = MAX_MSG_NUM * MSG_SIZE; 
// 队 列 元 数据 文件 大 小 (head + tail) 

private static final int META_SIZE = 8; 


BasicQueue 的 内 部 成 员 主要 就 是 两 个 MappedByteBuffer， 分 别 表示 
数据 和 元 数据 : 


private MappedByteBuffer dataBuf; 
private MappedByteBuffer metaBuf; 


BasicQueue 的 构造 方法 代码 是 : 


public BasicQueue(String path, String queueName) throws IOException { 
if(!path.endswith(File.separator)) { 
path += File.separator; 


} 

RandomAccessFile dataFile = null; 

RandomAccessFile metaFile = null; 

try 1 
dataFile = new RandomAccessFile(path + queueName + ".data", "rw"); 
metaFile = new RandomAccessFile(path + queueName + ".meta", "rw"); 


dataBuf = dataFile.getchannel().map(MapMode .READ_ WRITE, 0, 
DATA_FILE_ SIZE); 
metaBuf = metaFile.getchannel().map(MapMode.READ_ WRITE, 0, 
META_SIZE); 
} finally { 
if(dataFile != null) { 
dataFile.close(); 


} 

if(metaFile != null) { 
metaFile.close(); 

} 


为 了 方便 访问 和 修改 队列 头 尾 指 针 ， 我 们 定义 了 如 下 辅助 方法 : 


private int head() { 
return metaBuf .getIint(0); 
} 


private void head(int newHead) { 
metaBuf .putIint(0, newHead); 
} 


private int tail() { 
return metaBuf .getIint(4); 
} 


private void tail(int newTail) { 
metaBuf .putIint(4, newTail); 
3 


为 了 便于 判断 队列 是 空 还 是 满 ， 我 们 定义 了 如 下 方法 : 


private boolean isEmpty(){ 
return head() == tail(); 
3 


private boolean isFull(){ 
return (tail() + MSG_SIZE) % DATA_FILE_SIZE) == head(); 
} 


入 队 的 代码 为 : 


public void enqueue(byte[] data) throws IOException { 
if(data.length > MAX_MSG_BODY_SIZE) { 
throw new IllegalArgumentException("msg size is " + data.length 
+ ", while maximum allowed length is " + MAX_MSG_ BODY_SIZE); 


} 
if(isFull()) { 
throw new IllegalSstateException("queue is full"); 


} 

int tail = tail(); 

dataBuf .position(tail); 

dataBuf .putIint(data.1length); 

dataBuf .put (data); 

if(tail + MSG_SIZE >= DATA_FILE SIZE) { 
tail(0); 

} else { 
tail(tail + MSG_ SIZE); 

} 


基本 逻辑 十: 
1) 如 果 消 息 太 长 或 队列 满 ， 抛 出 异常 ; 
2) 找到 队列 尾 ， 定 位 到 队列 尾 ， 写 消息 长 度 ， 写 实际 数据 ; 


3) 更 新 队 列 尾 指针 ， 如 果 已 到 文件 尾 ， 再 从 头 开 始 。 
出 队 的 代码 为 : 


public byte[] dequeue() throws IOException { 
if(isEmpty()) { 
return null; 
} 
int head = head(); 
dataBuf .position(head); 
int length = dataBuf.getInt(); 
byte[] data = new byte[length]; 
dataBuf .get (data); 
if(head + MSG_SIZE >= DATA_FILE SIZE) { 
head(0); 
} else { 
head(head + MSG_ SIZE); 


return data; 


基本 逻辑 十: 

1) 如 果 队 列 为 空 ， 返 回 null; 

2) 找到 队列 头 ， 定 位 到 队列 头 ， 读 消息 长 度 ， 读 实际 数据 ; 
3) 更 新 队列 头 指 针 ， 如 果 已 到 文件 尾 ， 再 从 头 开始 ; 

4) 最 后 返回 实际 数据 。 


人 35 水 结 


本 下 介绍 了 内 存 映 射 文件 的 基本 概念 及 在 Java 中 的 用 法 ， 在 日 党 普 
通 的 文件 读 写 中 ， 我 们 用 到 得 比较 少 ， 但 在 一 些 系 统 程序 中 ， 它 却 是 
经 常 被 用 到 的 一 把 利器 ， 可 以 高 效 地 读 写 大 文件 ， 且 能 实现 不 同 程序 
间 的 共 译 和 通信 。 


利用 内 存 映射 文件 ， 我 们 设计 和 实现 了 一 个 简单 的 消息 队列 ， 消 
恩 可 以 持久 化 ， 可 以 实现 跨 程序 的 生产 者 /消费 者 通信 ， 我 们 演示 了 这 
个 消 明 队 列 的 功能 、 用 法 、 设 计 和 实现 代码 。 


14.4 ”标准 序列 化 机 制 


在 前 面 几 方 ， 我 们 在 将 对 象 保存 到 文件 时 ， 使 用 的 是 
DataOutputStream， 从 文件 读 入 对 象 时 ， 使 用 的 是 DataInputStream， 使 
用 它们 ， 需 要 逐个 处 理 对 象 中 的 每 个 字段 ， 我 们 提 到 ， 这 种 方式 比较 
烦琐 ，Java 中 有 一 种 更 为 简单 的 机 制 ， 那 惑 是 序列 化 。 


简单 来 说 ， 序 列 化 束 是 将 对 象 转化 为 字 节 流 ， 反 序列 化 就 是 将 字 
万 流转 化 为 对 象 。 在 Java 中 ， 有 具体 如 何 来 使 用 呢 ? 它 是 如 何 实现 的 ? 
什么 优 缺点 ? 本 和 吏 来 探讨 这 些 问 题 ， 我 们 先 从 它 的 基本 用 法 谈 

B 。 


14.4.1 基本 用 法 


要 让 一 个 类 文 持 序 列 化 ， 只 需要 让 这 个 类 实现 接口 
java.io.Serializable。Serializable 没 有 定义 任何 方法 ， 只 是 一 个 标记 接 
口 。 比 如 ， 对 于 前 面 章节 提 到 的 Student 类 ， 为 支持 序列 化 ， 可 改 为 ; 


public class Student implements Serializable { 
// 省 略 主体 代码 


} 


声明 实现 了 Serializable 接 口 后 ， 保 存 / 读 取 Student 对 象 束 可 以 使 用 
ObjectOutput-Stream/ObjectInputStream 流 了。ObjectOutputStream 是 
OutputStream 的 子 类 ， 但 实现 了 Object-Output 接 口 。ObjectOutput 是 
DataOutput 的 子 接口 ， 增 加 了 一 个 方法 : 


public void writeObject(Object obj) throws IOException 


这 个 方法 能 够 将 对 象 obj 转 化 为 子 方 ， 写 到 流 中 。 


ObjectInputStream 是 InputStream 的 子 类 ， 它 实现 了 ObjectInput 接 
口 。ObjectInput 是 DataInput 的 子 接口 ， 增 加 了 一 个 方法 : 


public Object readobject() throws ClassNotFoundException, IOException 


这 个 方法 能 够 从 流 中 读 取 字 市 ， 转 化 为 一 个 对 象 。 
使 用 这 两 个 流 ， 保 存 学 生 列表 的 代码 就 可 以 变 为 : 


public static void writeStudents(List<Student> students ) 
throws IOEXception { 
ObjectoutputStream out = new ObjectoutputStream( 
new BufferedoutputStream(new FileoutputStream(" Students ,dat"”) ) )， 
try { 
out.writeInt(students.size()); 
for(Student s : students) { 
out .writeObject(s); 


} 
} finally { 
out.close( ); 
} 


而 从 文件 中 读 入 学 生 列 表 的 代码 可 以 变 为 : 


public static List<Student> readStudents() throws IOException, 
ClassNotFoundException { 
ObjectInputStream in = new ObjectIinputStream(new BufferedInputStream( 
new FileInputStream("students.dat"))); 
try { 
int size = in.readInt(); 
List<Student> list = new ArrayList<>(size); 
for(int i = 0; i < size; i++) { 
list.add((Student) in.readobject()); 
} 


return list; 
} finally { 

in.close(); 
} 


实际 上 ， Rn 0 ee 
Lt ， 上 面 代码 还 可 以 进一步 简化 ， 只 需要 一 行 代码 ， 如 
和 个 : 


public static void writeStudents(List<Student> students ) 
throws IOEXception { 
ObjectOutputStream out = new ObjectOutputStream( 
new BufferedoutputStream(new FileOutputStream("students.dat"))); 


try { 
out ,writeobject(students ) ， 


} finally { 
out.close( ); 


} 
public static List<Student> readStudents() throws IOException, 
ClassNotFoundException { 
ObjectInputStream in = new ObjectInputStream(new BufferedInputStream( 
new FileInputStream("students.dat"))); 
try { 
return (List<Student>) in.readobject(); 
} finally { 
in.close(); 


是 不 是 很 神奇 ”只 要 将 类 声明 实现 Serializable 接 口 ， 然 后 就 可 以 
使 用 ObjectOutput-Stream/ObjectInputStream 直 接 读 写 对 象 了 。 我 们 之 前 
介绍 的 各 种 类 ， 如 String、Date、Double、ArrayList、LinkedList、 
HashMap、TreeMap 等 ， 都 实现 了 Serializable。 


14.4.2 ”复杂 对 象 


村 上 面 例子 中 的 Student 对 象 是 非常 简单 的 ， 如 果 对 象 比 较 复 杂 呢 ? 
0: 


1) 如 果 a、b 两 个 对 象 都 引用 同一 个 对 象 c， 序 列 化 后 c 是 保存 两 份 
还 是 一 份 ? 在 反 序列 化 后 还 能 让 a、b 指 向 同一 个 对 象 吗 ? 答案 是 ，c 只 
会 保存 一 份 ， 反 序列 化 后 指向 相同 对 象 。 


2) 如 果 a、b 两 个 对 象 有 循环 引用 呢 ? 即 a 引用 了 b， 而 b 也 引用 了 
a。 这 种 情况 Java 也 没 问 题 ， 可 以 保持 引用 关系 。 


这 就 是 Java 序 列 化 机 制 的 神奇 之 处 ， 它 能 目 动 处 理 引 用 同一 个 对 
象 的 情况 ， 也 能 目 动 处 理 循 环 引 用 的 情况 ， 具 体例 子 我 们 就 不 介绍 
了 ， 感 兴趣 可 以 参看 微 信 公众 号 “ 老 马 说 编程 ”第 62 篇 文章 。 


14.4.3 ”定制 序列 化 


默认 的 序列 化 机 制 已 经 很 强大 了 ， 它 可 以 目 动 将 对 象 中 的 所 有 字 
段 自动 保存 和 恢复 ， 但 这 种 默认 行为 有 时 候 不 是 我 们 想 要 的 。 


对 于 有 些 字 段 ， 它 的 值 可 能 与 内 存 位 置 有 关 ， 比 如 默认 的 
hashCode () 方法 的 返回 值 ， 当 恢复 对 象 后 ， 内 存 位 置 肯定 变 了 ， 基 
于 原 内 存 位 置 的 值 也 束 没 有 了 意义 。 还 有 一 些 子 段 ， 可 能 与 当前 时 间 
天 ， 比 如 表示 对 象 创建 时 的 时 间 ， 保 存 和 恢复 这 个 字段 就 古 不 正确 


还 有 一 些 情况 ， 如 有 果 类 中 的 字段 表示 的 是 类 的 实现 细 市 ， 而 非 逻 
辑 信 息 ， 那 默认 序列 化 也 是 不 适合 的 。 为 什么 不 适合 呢 ? 因 为 序列 化 
格式 表示 一 种 契约 ， 应 该 搬 述 类 的 逻辑 结构 ， 而 非 与 实现 细节 相 瑚 
定 ， 绑 定 实 现 细 市 将 使 得 难以 修改 ， 破 坏 封 狠 。 


比如 ， 我 们 在 容器 类 中 介绍 的 LinkedList， 它 的 默认 序列 化 就 是 不 
适合 的 。 为 什么 呢 ? 因为 LinkedList 表 示 一 个 List， 它 的 逻辑 信息 是 列 
表 的 长 度 ， 以 及 列表 中 的 每 个 对 象 ， 但 LinkedList 类 中 的 字段 表示 的 是 
ne 如 头 尾 节点 指针 ， 对 每 个 和 节点， 还 有 前 驱 和 后 继 节 
J 日 Yi 本? 


那 怎 么 办 呢 ? Java 提 供 了 多 种 定制 序列 化 的 机 制 ， 主 要 的 有 两 
种 : 一 种 是 transient 关键 字 ， 另 外 一 种 是 实现 writeObject 和 readObject 
J 


将 字段 声明 为 transient， 默 认 序列 化 机 制 将 忽略 该 字段 ， 不 会 进行 
是 。 比如， 类 LinkedList 中 ， 它 的 字段 都 声明 为 了 transient， 
中 人 小 : 


transient int size = 0; 
transient Node<E> first,; 
transient Node<E> last,; 


声明 为 了 transient， 不 是 说 就 不 保存 该 字段 了 ， 而 是 告诉 Java 默 认 
序列 化 机 制 ， 不 要 目 动 保存 该 字段 了 ， 可 以 实现 writeObject/readObject 
方法 来 自己 保存 该 字段 。 


类 可 以 实现 writeObject 方 法 ， 以 目 定 义 该 类 对 象 的 序列 化 过 程 ， 
其 声明 必须 为 : 


private void writeobject(java.io,0bjectoutputStream s) 
throws java.io.IOException 


可 以 在 这 个 方法 中 ， 调 用 ObjectOutputStream 的 方法 回流 中 写 入 对 
象 的 数据 。 比 如 ，LinkedList 使 用 如 下 代码 序列 化 列表 的 逻辑 数据 : 


private void writeobject(java.io,0bjectoutputStream s) 
throws java.io.IOException { 
s.defaultwriteobject(); 

// 写 元 素 个 数 

S ， writeInt(size); 

// 循 环 写 每 个 元 素 

for(Node<E> x = first; x != null; x = x.next) 
s.writeObject(x.item); 


需要 注意 的 是 代码 : 


s.defaultwriteobject(); 


一 行 是 必需 的 ， 它 会 调用 默认 的 序列 化 机 制 ， 默 认 机 制 会 保存 
所 没 志 明 为 transient 的 字段 ， 即 使 类 中 的 所 有 字段 都 是 transient， 也 
应 该 写 这 一 行 ， 因 为 Java 的 序列 化 机 制 不 仅 会 保存 纯粹 的 数据 信息 ， 
还 会 保存 一 些 元 数据 描述 等 隐藏 信息 ， 这 些 隐 藏 的 信息 是 序列 化 之 所 
以 能 够 神奇 的 重要 原因 。 


与 人 是 readObject 方 法 ， 通 过 它 自 定 义 反 序列 化 过 
程 ， 其 声明 必须 为 : 


private void readobject(java.io.0ObjectIinputStream s) 
throws java.io.IOException, ClassNotFoundException 


在 这 个 方法 中 ， 调 用 ObjectInputStream 的 方法 从 流 中 读 入 数据 ， 
然后 初始 化 类 中 的 成 员 变 量 。 比 如 ，LinkedList 的 反 序列 化 代码 为 : 


private void readobject(java.io.0ObjectIinputStream s) 
throws java.io.IOException, ClassNotFoundException { 
s.defaultReadobject(); 

// 读 元 素 个 数 
int size = s.readInt(); 
// 循 环 读 入 每 个 元 素 


for (int i = 0; i < Size) i++) 


> 


linkLast((E)s.readobject()); 


注意 代码 : 


s.defaultReadobject( ) ; 


这 一 行 代码 也 是 必需 的 。 


除了 目 定 义 writeObjectreadObject 方 法 ， 还 有 一 些 目 定 义 序列 化 过 
程 的 机 制 : Exter-nalizable 接 口 、readResolve 方 法 和 writeReplace 方 法 ， 
这 些 机 制 用 得 相对 较 少 ， 我 们 就 不 介绍 了 。 


14.4.4 ”序列 化 的 基本 原理 
稍微 总 结 一 下 。 


1) 如 采 类 的 字段 表示 的 就 是 类 的 逻辑 信息 ， 如 上 面 的 Student 
， 那 束 可 以 使 用 默认 序列 化 机 制 ， 只 要 声明 实现 Serializable 接 口 即 
口 | oe 


2) 否则 的 话 ， 如 LinkedList， 那 束 可 以 使 用 transient 关 键 字 ， 实 现 
writeObject 和 和 read-Object 自 定义 序列 化 过 程 。 


3) Java 的 序列 化 机 制 可 以 自动 处 理 如 引用 同一 个 对 象 、 循 环 引用 


等 情况 。 


序列 化 到 底 是 如 何 发 生 的 呢 ? 关键 在 ObjectOutputStream 的 
writeObject 和 ObjectInput-Stream 的 readObject 方 法 内 。 它 们 的 实现 都 非 
常 复 杂 ， 正 因为 这 些 复杂 的 实现 才 使 得 序列 化 看 上 去 很 神奇 ， 我 们 简 
单 介绍 其 基本 逻辑 。 


writeObject 的 基本 逻辑 是 : 
1) 如 果 对 象 没 有 实现 Serializable， 抛 出 异常 


NotSerializableException ° 


2) 每 个 对 象 都 有 一 个 编号 ， 如 果 之 前 已 经 写 过 该 对 象 了 ， 则 本 次 
只 会 写 该 对 象 的 引用 ， 这 可 以 解决 对 象 引 用 和 循环 引用 的 问题 。 
3) 如 果 对 象 实现 了 writeObject 方 法 ， 调 用 它 的 自 定 义 方 法 。 


4) 默认 是 利用 反射 机 制 (反射 在 第 21 音 介绍) ， 斋 历 对 象 结构 
图 ， 对 每 个 没有 标记 为 ransient 的 字段 ， 根 据 其 类 型 ， 分 别 进行 处 理 ， 
写 出 到 流 ， 流 中 的 信息 包括 字段 的 类 型 ， 即 完整 美 名 、 字 段 名 、 字段 

等 。 


readObject 的 基本 逻辑 是 : 

1) 不 调用 任何 构造 方法 ; 

2) 它 自己 就 相当 于 是 一 个 独立 的 构造 方法 ， 根 据 字 市 流 初始 化 对 
象 ， 利 用 的 也 是 反射 机 制 ; 


3) 在 解析 字 厄 流 时 ， 对 于 引用 到 的 类 型 信息 ， 会 动态 加 载 ， 如 果 
找 不 到 类 ， 会 抛 出 ClassNotFoundException 。 


14.4.5 ”版 本 问题 


前 面 的 介绍 ， 我 们 忽略 了 一 个 问题 ， 那 区 是 版 本 问题 。 我 们 知 
道 ， 代 码 是 在 不 断 演化 的 ， 而 序列 化 的 对 象 可 能 是 持久 保存 在 文件 上 
的 ， 如 有 果 类 的 定义 发 生 了 变化 ， 那 持久 化 的 对 象 还 能 反 序列 化 吗 ? 


默认 情况 下 ，Java 会 给 类 定义 一 个 版 本 号 ， 这 个 版 本 号 是 根据 类 
中 一 系列 的 信息 目 动 生成 的 。 在 反 序列 化 时 ， 如 有 果 类 的 定义 发 生 了 变 
化 ， 版 本 号 束 会 变化 ， 与 流 中 的 版 本 号 束 会 不 匹配 ， 反 序列 化 就 会 抛 
出 异常 ， 类 型 为 java.io.InvalidClassException 。 


通 种 情况 下 ， 我 们 希望 目 定义 这 个 版 本 号 ， 而 非 让 Java 目 动 生 
成 ， 一 方面 是 为 了 更 好 地 控制 ， 另 一 方面 是 为 了 性 能 ， 因 为 Java 目 动 
生成 的 性 能 比较 低 。 怎 么 目 定义 呢 ? 在 类 中 定义 如 下 变量 : 


private static final long serialVersionUID = 1L; 


在 Java IDE 如 Eclipse 中 ， 如 有 末 声 明 实 现 了 Serializable 而 没有 定义 该 
变量 ，IDE 会 提示 目 动 生 成 。 这 个 变量 的 值 可 以 是 任意 的 ， 代 表 该 类 
的 版 本 号 。 在 序列 化 时 ， 会 将 该 值 写 入 流 ， 在 反 序 列 化 时 ， 会 将 流 中 
的 值 与 类 定义 中 的 值 进 行 比 较 ， 如 果 不 匹 配 ， 会 抛 出 


InvalidClassException ° 


那 如 果 版 本 号 一 样 ， 但 实际 的 字段 不 匹配 呢 ?Java 会 分 情况 目 动 
进行 处 理 ， 以 尽量 保持 兼容 性 ， 大 概 分 为 三 种 情况 : 
本 
格 ; 
ee 

:字段 类 型 变 了 : 对 于 同名 的 字段 ， 类 型 变 了 ， 会 抛 出 


InvalidClassException ° 


14.4.6 ” 厅 列 化 特点 分 析 


序列 化 的 主要 用 途 有 两 个 :一 个 是 对 和 象 持 久 化 ， 男 一 个 是 跨 网 络 
的 数据 交换 、 远 程 过 程 调用 。Java 标 准 的 序列 化 机 制 有 很 多 优点 ， 使 
用 简单 ， 可 目 动 处 理 对 象 引 用 和 循环 引用 ， 也 可 以 方便 地 进行 定制 ， 
处 理 版 本 问题 等 ， 但 它 也 有 一 些 重要 的 局 限 性 。 


1) Java 序 列 化 格式 是 一 种 私有 格式 ， 是 一 种 Java 特 有 的 技术 ， 不 
能 被 其 他 语言 识别 ， 不 能 实现 路 语言 的 数据 交换 。 


” “2) Java 在 序列 化 字 节 中 保存 了 很 多 描述 信息 ， 使 得 序列 化 格式 比 


较 


3) Java 的 默认 序列 化 使 用 反射 分 析 遍 历 对 象 结构 ， 性 能 比较 低 。 
4) Java 的 序列 化 格式 是 二 进 制 的 ， 不 方便 查看 和 修改 。 


由 于 这 些 局 限 性 ， 实 践 中 往往 会 使 用 一 些 蔡 代 方 案 。 在 跨 语 言 的 
数据 交换 格式 中 ，XML/JSON 是 被 广泛 采用 的 文本 格式 ， 各 种 语言 都 


有 对 它们 的 文 持 ， 文 件 格式 清晰 易 读 。 有 很 多 查看 和 编辑 工具 ， 它 们 
的 不 足 之 处 是 性 能 和 序列 化 大 小 ， 在 性 能 和 大 小 敏感 的 领域 ， 往 往 会 
采用 更 为 精简 高 效 的 二 进 制 方式 ， 如 ProtoBuf、Thrift、MessagePack 
等 。 


至 此 ， 关 于 Java 的 标准 序列 化 机 制 就 介绍 完了 。 我 们 介绍 了 它 的 
用 法 和 基本 原理 ， 最 后 分 析 了 它 的 特点 ， 它 是 一 种 神奇 的 机 制 ， 通 过 
人 简单 的 Serializable 接 口 束 能 目 动 处 理 很 多 复杂 的 事情 ， 但 它 也 有 一 些 
重要 的 限制 ， 最 重要 的 是 不 能 跨 语言 。 


14.5 “使 用 Jackson 序 列 化 为 
JSON/XML/MessagePack 


由 于 Java 标 准 序 列 化 机 制 的 一 些 限制 ， 实 践 中 经 常 使 用 一 些 蔡 代 方 
案 ， 比 如 XML/JSON/MessagePack。Java SDK 中 对 这 些 格式 的 支持 有 
限 ， 有 很 多 第 三 方 的 类 库 提供 了 更 为 方便 的 文 持 ，Jackson 是 其 中 一 
种 ， 它 支持 多 种 格式 ， 包 括 XML/JSON/MessagePack 等 ， 本 市 就 来 介绍 
如 何 使 用 Jackson 进 行 序 列 化 。 我 们 先 来 简单 了 解 下 这 些 格式 以 及 


Jackson ° 


14.5.1 基本 概念 


XML/JSON 都 是 文本 格式 ， 都 容易 阅读 和 理解 ， a 
不 介绍 了 ， 后 面 我 们 会 看 到 一 些 例子 ， 来 演示 其 基本 格式 。 XML 十 
早 流行 的 足 谨 言 数据 交换 标准 格式 ， 如 果 不 熟 悉 ， 可 以 查看 
http://www.w3school.com.cn/xml/ 快速 了 解 。JSON 是 一 种 更 为 简单 的 格 
式 ， 最 近 几 年 来 越 来 越 流行 ， 如 果 不 熟 悉 ， 可 以 查看 
http://json.org/json-zh.html 。MessagePack 是 一 种 二 进 制 形式 的 JSON， 
编码 更 为 精简 高 效 ， 官 网 地 址 是 http:/msgpack.org/。JSON 有 多 种 二 进 
制 形 式 ，MessagePack 只 是 其 中 一 种 。 


Jackson 的 Wiki 地 址 是 http:/wiki.fasterxml.com/JacksonHome ， 它 起 
初 主要 是 用 来 支持 JSON 格 式 的 ， 现 在 也 支持 很 多 其 他 格式 ， 它 的 各 种 
方式 的 使 用 方式 是 类 似 的 。 要 使 用 Jackson， 需 要 下 载 相应 的 库 。 对 于 
JSONVXML ， 本 万 使 用 2.8.5 版 本 ， 对 于 MessagePack， 本 万 使 用 0.8.11 版 
本 ， 所 有 依赖 库 均 可 从 以 下 地 址 下 载 : 
https://github.com/swiftma/program-logic/tree/master/jackson_libs 。 配 置 


好 依赖 库 后 ， 下 面 我 们 就 来 介绍 如 何 使 用 。 
14.5.2 基本 用 法 


我 们 还 是 通过 Student 类 来 演示 Jackson 的 基本 用 法 ， 格 式 包 括 
JSON 、XML 和 Message-Pack 。 


1.JSON 
序列 化 一 个 Student 对 象 的 基本 代码 为 : 


Student student = new Student(" 张 三 ", 18, 80.9d); 
ObjectMapper mapper = new ObjectMapper(); 

mapper .enable(SerializationFeature.INDENT_OUTPUT); 
String str = mapper .writeValueAsString(student); 
System.out.printin(str); 


Jackson 序 列 化 的 主要 类 是 ObjectMapper， 它 是 一 个 线程 安全 的 
类 ， 可 以 初始 化 并 配置 一 次 ， 被 多 个 线程 共享 ， 
SerializationFeature.INDENT_OUTPUT 的 目的 是 格式 化 输出 ， 以 便于 阅 
读 。ObjectMapper 的 writeValueAsString 方 法 就 可 以 将 对 象 序 列 化 为 字符 
串 ， 输 出 为 : 


"namen 四 " 张 三 LD 
a = 

"age" : 18, 

"score" : 80.9 


ObjectMapper 还 有 其 他 方法 ， 可 以 输出 学 节 数 组 ， 写 出 到 文件 、 
OutputStream、Writer 等 ， 方 法 声明 如 下 : 


public byte[] writevValueAsBytes(Object value) 
public void writeValue(OutputStream out, Object value) 
public void writeValue(Writer w, Object value) 
public void writeValue(File resultFile, Object value) 


比如 ， 输 出 到 文件 "student.json"， 代 码 为 : 


mapper .writeValue(new File("student.json"), student); 


ObjectMapper 怎 么 知道 要 保存 哪些 字段 呢 ? 与 Java 标 准 序列 化 机 制 
一 样 ， 它 也 使 用 反射 ， 默 认 情 况 下 ， 它 会 保存 所 有 声明 为 public 的 字 
段 ， 或 者 有 public getter 方 法 的 字段 。 


反 序 列 化 的 代码 如 下 所 示 : 


ObjectMapper mapper = new ObjectMapper() 
Student s = mapper.readValue(new File("student.json"), Student.class); 
System.out.println(s,.toString() )， 


使 用 readValue 方 法 反 序 列 化 ， 有 两 个 参数 : 一 个 是 输入 源 ， 这 里 
是 文件 student.json; 男 一 个 是 反 序列 化 后 的 对 象 类 型 ， 这 里 是 
Student.class， 输 出 为 : 


Student [name= 张 三 ，age=18， score=80.9] 


说 明 反 序列 化 的 结果 是 正确 的 ， 除 了 接受 文件 ， 还 可 以 是 字 节 数 
组 、 字 符 串 、Input-Stream、Reader 等 ， 如 下 所 示 : 


public <T> T readValue(InputStream src, Class<T> valueType) 
public <T> T readValue(Reader src, Class<T> valueType) 
public <T> T readValue(String content, Class<T> valueType) 
public <T> T readValue(byte[] src, Class<T> valueType) 


在 反 序 列 化 时 ， 默 认 情况 下 ，Jackson 假 定 对 象 类 型 有 一 个 无 参 的 
人 它 会 先 调用 该 构造 方法 创建 对 象 ， 然 后 解析 输入 源 进行 反 
序列 化 。 


2.XML 


使 用 类 似 的 代码 ， 格 式 可 以 为 XML ， 唯 一 需要 改变 的 是 替换 
ObjectMapper 为 Xml-Mapper 。XmlMapper 是 ObjectMapepr 的 子 类 ， 序 列 
化 代码 为 : 


Student student = new Student(" 张 三 ", 18, 80.9d); 
ObjectMapper mapper = new XmlMapper(); 

mapper .enable(SerializationFeature.INDENT_OUTPUT); 
String str = mapper.writevVvalueAsString(student); 
mapper .writeValue(new File("student.xml"), student); 
System.out.printin(str); 


输出 为 : 


<Student> 
<name> 张 三 </name> 


<age>18</age> 
<score>80.9</score> 
</Student> 


反 序 列 化 代码 为 : 


ObjectMapper mapper = new XmlMapper(); 
Student s = mapper.readValue(new File("student.xml"), Student.class); 
System.out,.println(s,toString() )， 


3.MessagePack 


类 似 的 代码 ， 格 式 可 以 为 MessagePack， 同 样 使 用 ObjectMapper 
类 ， 但 传递 一 个 Mess-agePackFactory 对 象 。 男 外 ，MessagePack 是 二 进 
制 格 式 ， 不 能 写 出 为 String， 可 以 写 出 为 文件 、OutpuStream 或 字 市 数 
组 。 序 列 化 代码 为 : 


Student student = new Student(" 张 三 ", 18, 80.9d); 

ObjectMapper mapper = new ObjectMapper(new MessagePackFactory()); 
byte[] bytes = mapper .writeValueAsBytes(student); 

mapper .writeValue(new File("student.bson"), student); 


序列 后 的 字 节 如 图 14-4 所 示 。 


00000000h: 83 A4 6E 61 6D 65 A6 E5 BC RAR0O E4 B8 89 A3 61 67 ; .Mname|a&%.8,.£ag 
00000010h: 65 12 AM5 73 63 6F 72 65 CB 40 54 39 99 99 99 99 ; e.¥scoreE@T9.... 


00000020h: 9aA LL | 


图 14-4 ”MessagePack 序 列 化 示例 
反 序 列 化 代码 为 : 


ObjectMapper mapper = new ObjectMapper (new MessagePackFactory()); 
Student s = mapper.readValue(new File("student.bson"), Student.class); 
System.out.println(s.toString() )， 


14.5.3 ”容器 对 象 


对 于 容器 对 象 ，Jackson 也 是 可 以 自动 处 理 的 ， 但 用 法 稍 有 不 同 ， 
我 们 来 看 下 List 和 Map 。 


1.List 
序列 化 一 个 学 生 列 表 的 代码 为 : 


List<Student> Students = Arrays.asList(new Student[] { 

new Student(" 张 三 "，18，80.9d)，new Student(" 李 四 "，17，67.5d) }); 
ObjectMapper mapper = new ObjectMapper() 
mapper .enable(SerializationFeature.INDENT_OUTPUT); 
String str = mapper,.writevalueAsString(Sstudents ) ; 
mapper .writeValue(new File("students.json"), students); 
System.out.printin(str); 


这 与 序列 化 一 个 学 生 对 象 的 代码 是 类 似 的 ， 输 出 为 : 


由 本 " 张 三 " 
a —* 
"age" : 18, 
"score" : 80.9 

}, 
name" | "他 四 5 
"age" :; 17, 
"score" : 67.5 

}] 


反 序 列 化 代码 不 同 ， 要 新 建 一 个 TypeReference 匿 名 内 部 类 对 和 象 来 
指定 类 型 ， 代 码 如 下 所 示 : 


ObjectMapper mapper = new ObjectMapper(); 

List<Student> list = mapper.readValue(new File("students.json"), 
new TypeReference<List<Student>>() {€}); 

System.out.printin(list.tostring()); 


XML/MessagePack 的 代码 是 类 似 的 ， 我 们 就 不 性 述 了 。 
2.Map 
Map 与 List 类 似 ， 序 列 化 不 需要 特殊 处 理 ， 但 反 序 列 化 需要 通过 


TypeReference 指 定 类 型 ， 我 们 看 一 个 XML 的 例子 。 序 列 化 一 个 学 生 
Map 的 代码 为 : 


Map<String, Student> map = new HashMap<String, Student>(); 
map.put("zhangsan", new Student(" 张 三 ", 18, 80.9d)); 
map.put("lisi", new Student(" 李 四 ", 17, 67.5d)); 
ObjectMapper mapper = new XmlMapper(); 

mapper .enable(SerializationFeature.INDENT_OUTPUT); 

String str = mapper .writeValueAsString(map); 

mapper .writeValue(new File("students map.xml"), map); 
System.out.printin(str); 


输出 为 : 


<HashMap> 
<l]isi> 
<name> 李 四 </name> 
<age>17</age> 
<score>67.5</score> 
</l1isi> 
<zhangsan> 
<name> 张 三 </name> 
<age>18</age> 
<score>80.9</score> 
</zhangsan> 
</HashMap> 


反 序 列 化 的 代码 为 : 


ObjectMapper mapper = new XmlLMapper() 

Map<String，Student> map = mapper.readValue(new File("students map.xml"), 
new TypeReference<Map<String, Student>>() {}); 

System.out.printlin(map.toSstring()); 


14.5.4 复杂 对 象 


对 于 复杂 一 些 的 对 象 ，Jackson 也 是 可 以 自动 处 理 的 ， 我 们 让 
Student 类 稍微 复杂 一 些 ， 改 为 如 下 定义 : 


public class ComplexStudent { 
String name; 
int age; 
Map<String, Double> Scores 
ContactInfo contactInfo ， 
// 省 略 构造 方法 和 getter/setter 方 法 


分 数 改 为 一 个 Map， 键 为 课程 ，ContactInfo 表 示 联 系 信 息 ， 是 一 1 
单独 的 类 ， 定 义 如 下 : 


public class ContactInfo { 
String phone; 
String address,; 
String email; 
// 省 略 构 造 方法 和 getter/setter 方 法 


} 


构建 一 个 ComplexStudent 对 象 ， 代 码 为 : 


ComplexStudent student = new ComplexStudent(" 张 三 "，18)， 
Map<String, Double> ScoreMap = new HashMap<>(); 
scoreMap .put(" 语 文 "，89d); 

scoreMap .put(" 数 学 "，83d); 

student.setScores(scoreMap); 

ContactInfo contactInfo = new ContactIinfo(); 
contactInfo.setPhone("18500308990" ) 
contactInfo.setEmail("zhangsan@sina.com'")， 
contactInfo.setAddress(" 中 关 村 " ) ; 

student ,setContactInfo(contactInfo ) ; 


我 们 看 JSON 序 列 化 ， 代 码 没 有 特殊 的 ， 如 下 所 示 : 


ObjectMapper mapper = new ObjectMapper() 
mapper .enable(SerializationFeature.INDENT_OUTPUT); 
mapper .writeValue(System.out, student); 


输出 为 : 


{ "namen : " 张 码 " 

"age" : 18, 

"scores" : { 
"语文 " : 89.0， 
"数学 " : 83.0 

}, 

"contactInfo" : { 
"phone" :; "18500308990", 
naddress" : "中 关 村 "， 
"email" : "zhangsan@sina.com" 

} 
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XML 格式 的 代码 也 是 类 似 的 ， 符 换 ObjectMapper 为 XmlMapper 即 
可 ， 输 出 为 : 


<ComplexSstudent> 
<name> 张 三 </name> 
<age>18</age> 
<scores> 
< 语文 >89 .0</ 语 文 > 
< 数学 >83 .0</ 数 学 > 
</scores> 
<ContactInfo> 
<phone>18500308990</phone> 
<address> 中 关 村 </address> 
<email>zhangsan@sina.com</email> 
</contactInfo> 
</ComplexSstudent> 


反 序 列 化 的 代码 也 不 需要 特殊 处 理 ， 指 定 类 型 为 
ComplexStudent.class 即 可 。 


14.5.5 “定制 序列 化 


上 面 的 例子 中 ， 我 们 没有 做 任何 定制 ， 默认 的 配置 就 是 可 以 的 。 
0 我 们 需要 做 一 些 配 置 ，Jackson 主 要 支持 两 种 配置 方 
了 o 

1) 注解 ， 后 续 章 节 会 详细 介绍 注解 ， 这 里 主要 是 介绍 Jackson 一 些 
注解 的 用 法 。 


2) 配置 ObjectMapper 对 象 ，ObjectMapper 支 持 对 序列 化 和 反 序列 
化 过 程 做 一 些 配 置 ， 前 面 使 用 的 SerializationFeature.INDENT_OUTPUT 
是 其 中 一 种 。 


哪些 情况 需要 配置 呢 ? 我 们 看 一 些 典 型 的 场景 。 


. 1) 配置 达到 类 似 标准 序列 化 中 transient 天 键 字 的 效果 ， 和 忽略 一 些 
字段 。 


2) 在 标准 序列 化 中 ， 可 以 目 动 处 理 引 用 同一 个 对 象 、 循 环 引 用 的 
情况 ， 反 序列 化 时 ， 可 以 自动 忽略 不 认识 的 字段 ， 可 以 上 自动 处 理 继承 
多 态 ， 但 Jackson 都 不 能 自动 处 理 ， 这 些 情况 都 需要 进行 配置 。 


3) 标准 序列 化 的 结果 是 二 进 制 、 不 可 读 的 ， 但 XMLASON 格 式 是 
可 读 的 ， 有 了 时 我 们 希望 控制 这 个 显示 的 格式 。 


4) 默认 情况 下 ， 反 序列 时 ，Jackson 要 求 类 有 一 个 无 参 构造 方法 ， 
但 有 时 类 没有 无 参 构造 方法 ，Jackson 支 持 配 置 其 他 构造 方法 。 


针对 这 些 场景 ， 我 们 分 别 介绍 。 
1. 忽 上 略 字段 


在 Java 标 准 序 列 化 中 ， 如 果 字 段 标 记 为 了 transient， 束 会 在 序列 化 
中 被 忽略 ， 在 Jack-son 中 ， 可 以 使 用 以 下 两 个 注解 之 一 。 


““@JsonIgnore: 用 于 字段 、getter 或 setter 方 法 ， 任 一 地 方 的 效 采 都 


.@JsonIgnoreProperties: 用 于 类 声明 ， 可 指定 忽略 一 个 或 多 个 字 
段 o 


比如 ， 上 面 的 Student 类 ， 名 略 分 数字 段 ， 可 以 为 : 


Q@JsonIgnore 
double Score 


也 可 以 修饰 getter 方 法 ， 如 : 


@JsonIgnore 
public double getScore() { 
return score; 


} 


也 可 以 修饰 Student 类 ， 如 : 


@JsonIgnoreProperties("score") 
public class Student { 


加 了 以 上 任 一 标记 后 ， 序 列 化 后 的 结果 中 将 不 再 包含 score 字 上 段 ， 
在 反 序 列 化 时 ， 即 使 输入 源 中 包含 score 字 段 的 内 容 ， 也 不 会 给 score 字 


段 赋 值 。 
2. 引 用 同一 个 对 象 


我 们 看 个 位 单 的 例子 ， 有 两 个 类 Common 和 A，A 中 有 两 个 
1 为 便于 演示 ， 我 们 将 所 有 属性 定义 为 了 public， 它 们 的 
类 定义 如 下 : 


static class Common { 
public String name; 


static class Af 
public Common first; 
public Common second,; 


} 


有 一 个 A 对 象 ， 如 下 所 示 : 


Common c = new Common(); 
c.name= "common"; 

Aa= new A(); 

a.first = a.second = c; 


a 对 和 象 的 first 和 second 都 指向 都 一 个 c 对 象 ， 不 加 额外 配置 ， 序 列 化 a 
的 代码 为 : 


ObjectMapper mapper = new ObjectMapper(); 
mapper.enable(SerializationFeature.INDENT_OUTPUT); 
String str = mapper .writeValueAsString(a); 
System.out.printin(str); 


输出 为 : 


{ 
"first” : { 
"name" : "abc" 
时 
"second™" : { 
"name" : "abc" 


在 反 序 列 化 后 ，first 和 和 second 将 指 癌 不 同 的 对 象 ， 如 下 所 示 : 


A a2 = mapper.readValue(str, A.class); 
if(a2.first == a2.Second ){ 
System.out.printin("reference Same object"); 
}elsef{ 
System.out,.println("reference different objects"); 


- 作 、 让 
输出 为 : 
reference different objects 


那 怎样 才能 保持 这 种 对 同一 个 对 象 的 引用 关系 呢 ? 可 以 使 用 注解 
@JsonIdentityInfo， 对 Common 类 做 注解 ， 如 下 所 示 : 


@JsonIdentityInfo( 
generator = ObjectIidGenerators.IntSequenceGenerator.class, 
property="id") 
static class Common { 
public String name; 


@JsonIdentityInfo 中 指定 了 两 个 属性 ，property="id" 表 示 在 序列 化 
输出 中 新 增 一 个 属性 "id" 以 表示 对 象 的 唯一 标示 ，generator 表 示 对 和 象 唯 
一 JD 的 产生 方法 ， 这 里 是 使 用 整数 顺序 数 产 生 器 


IntSequenceGenerator ° 


加 了 这 个 标记 后 ， 序 列 化 输出 会 变 为 : 


了 
"name"” : "common" 


了 
"second" : 1 


} 


注意 : "first" 中 加 了 一 个 属性 "id"， 而 "second" 的 值 只 是 1， 表 示 引 
2 这 个 格式 反 序 列 化 后 ，first 和 second 会 指 回 同一 个 对 


3. 循 环 引用 


我 们 看 个 循环 引用 的 例子 。 有 两 个 类 Parent 和 Child， 它 们 相互 引 
用 ， 为 便于 演示 ， 我 们 将 所 有 属性 定义 为 了 public， 类 定义 如 下 : 


static class Parent { 
public String name; 
public Child child; 


static class Child { 
public String name; 
public Parent parent,; 


} 


有 一 个 对 象 ， 如 下 所 示 : 


Parent parent = new Parent(); 
parent.name = " 老 马 "， 

Child child = new Child(); 
child.name = "小 马 "， 
parent.child child; 
child.parent parent,; 


如 果 序 列 化 parent 这 个 对 象 ，Jackson 会 进入 无 限 循 环 ， 最 终 抛 出 异 
常 ， 解 决 这 个 问题 ， 可 以 分 别 标 记 Parent 类 中 的 child 和 Child 类 中 的 
parent 字 段 ， 将 其 中 一 个 标记 为 主 引 用 ， 而 兄 一 个 标记 为 反 加 引用 ， 主 
引用 使 用 @JsonManagedReference， 反 加 引用 使 用 
@JsonBackReference， 如 下 所 示 : 


static class Parent { 
public String name; 
@JsonManagedReference 
public Child child; 


} 

static class Child { 
public String name; 
Q@JsonBackReference 
public Parent parent,; 


} 


oe 序列 化 就 没有 问题 了 。 我 们 看 XML 格式 的 序列 


ObjectMapper mapper = new XmlMapper(); 
mapper.enable(SerializationFeature.INDENT_OUTPUT); 
String str = mapper .writeValueAsString(parent); 
System.out.printin(str); 


输出 为 : 


<Parent> 
<name> 老 马 </name> 
<child> 
<name> 小 马 </name> 
</child> 
</Parent> 


在 输出 中 ， 反 癌 引 用 没有 出 现 。 不 过 ， 在 反 序列 化 时 ，Jackson 会 
目 动 设置 Child 对 象 中 的 parent 字 段 的 值 ， 比 如 : 


Parent parent2 = mapper.readValue(str, Parent.c]lass); 
System.out.println(parent2.child,.parent .name); 


和 输出 为 : 老 弓 。 说 明 标 记 为 反 回 引用 的 字段 的 值 也 被 正确 设置 
4. 反 序列 化 时 忽略 未 知 字段 
在 Java 标 准 序列 化 中 ， 反 序列 化 时 ， 对 于 未 知 字段 会 目 动 忽 略 ， 但 


在 Jackson 中 ， 默 认 情 况 下 会 抛 出 异常 。 还 是 以 Student 类 为 例 ， 如 果 
student.json 文 件 的 内 容 为 : 


{ "namen 四 " 张 三 " 
' 一 
"age" : 18, 
"score": 333, 
nother": nm 革 他 信息 " 
} 


其 中 ，other 属 性 是 Student 类 没有 的 ， 如 果 使 用 标准 的 反 序 列 化 代 


ObjectMapper mapper = new ObjectMapper() 
Student s = mapper.readValue(new File("student.json"), Student.class); 


Jackson 会 抛 出 异 名 : 


com.fasterxml.jackson.databind.exc.UnrecognizedPropertyException: Unrecognized 
field "other" 


怎样 才能 忽略 不 认识 的 字段 呢 ? 可 以 配置 ObjectMapper， 如 下 所 


修 \: 


ObjectMapper mapper = new ObjectMapper(); 
mapper.disable(DeserializationFeature.FAIL ON_UNKNOWN_PROPERTIES); 
Student s = mapper.readValue(new File("student.json"), Student.c]lass); 


这 样 就 没 问 题 了 7， 这 个 属性 是 配置 在 整个 ObjectMapper 上 上 的， 如果 
只 是 希望 配置 Student 类 ， 可 以 在 Student 类 上 使 用 如 下 注解 : 


@JsonIgnoreProperties(ignoreUnknown=true) 
public class Student { 
/A/a 


此 
5. 继 承 和 多 态 


Jackson 也 不 能 上 自动 处 理 多 态 的 情况 。 我 们 看 个 例子 ， 有 4 个 类 ， 定 
义 如 下 ， 我 们 忽略 了 构造 方法 和 getter/setter 方 法 : 


static class Shape { 


static class Circle extends Shape { 
private int r,; 


static class Square extends Shape { 
private int 1; 


static class ShapeManager { 
private List<Shape> shapes; 


ShapeManager 中 的 Shape 列 表 中 的 对 象 可 能 是 Circle， 也 可 能 是 
Square。 比 如 ， 有 一 个 ShapeManager 对 象 ， 如 下 所 示 : 


ShapeManager sm = new ShapeManager() 
List<Shape> Shapes = new ArrayList<Shape>(); 
shapes.add(new Circle(10)); 

shapes.add(new Square(5)); 
sm.setSshapes(shapes); 


使 用 JSON 格 式 序列 化 ， 输 出 为 : 


"Shapes"”: [ { 
a ko) 
,i 
TE : 5 
}] 
} 


个 输出 看 上 去 是 没有 问题 的 ， 但 由 于 输出 中 没有 类 型 信息 ， 反 
二 Jackson 不 知道 具体 的 Shape 类 型 是 什么 ， 束 会 抛 出 异常 。 


解决 方法 是 在 输出 中 包 侣 类 型 信息 ， 在 基 类 Shape 前 使 用 如 下 注 


@JsonTypeInfo(use = Id.NAME, include = As.PROPERTY, property = "type") 
@JsonsubTypes({ 
@JsonsubTypes.Type(value 
@JsonSubTypes,Type(value 
static class Shape { 


Circle.class, name 
Square.class, name 


"circle"), 
"square") }) 


这 些 注解 看 上 去 比较 多 ,含义 是 指 在 输出 中 增加 属性 "type"， 表 示 
对 象 的 实际 类 型 ， 对 Circle 类 ， 使 用 "circle" 表 示 其 类 型 ， 而 对 于 Square 
类 ， 使 用 "square"。 加 了 注解 后 ， 序 列 化 输出 变 为 : 


"shapes" : [ { 


"type" : "circle", 
"r" :; 10 

, { 

"type" . "square", 
Le 5 

}] 


这 样 ， 反 序列 化 时 就 可 以 正确 解析 了 。 


6. 修 改 字 段 名称 


对 于 XML/JSON 格 式 ， 有 时， 我 们 希望 修改 输出 的 名 称 ， 比 如 对 
Student 类 ， 我 们 希望 输出 的 字段 名 变 为 对 应 的 中 文 ， 可 以 使 用 
@JsonProperty 进 行 注 解 ， 如 下 所 示 : 


public class Student { 
@JsonProperty(" 名 称 ") 
String name; 
@JsonProperty(" 年 龄 ") 
int age; 
@JsonProperty(" 分 数 ") 
double score; 


名 称 ”: " 张 三 
"年 龄 " ; 18 
' 分 数 " ; 80.9 


对 于 XML 格 式 ， 一 个 常用 的 修改 是 根 元 素 的 名 称 。 默 认 情 况 下 ， 
它 是 对 象 的 类 名 ， 比 如 对 Student 对 象 ， 它 是 "Student"， 如 果 希 望 修 
改 ， 比 如 改 为 小 写 "student"， 可 以 使 用 @JsonRootName 修 饰 整个 类 ， 如 
下 所 示 : 


@JsonRootName("student") 
public class Student { 


7. 格 式 化 日 期 
默认 情况 下 ， 日 期 的 序列 化 格式 为 一 个 长 整数 ， 比 如 : 


static class MyDate { 
public Date date = new Date(); 
} 


序列 化 代码 : 


MyDate date = new MyDate( ) 
ObjectMapper mapper = new ObjectMapper(); 
mapper .writeValue(System.out, date); 


输出 如 下 所 示 : 


{"date":1482758152509} 


这 个 格式 是 不 可 读 的 ， 怎 样 才 能 可 读 呢 ? 使 用 @JsonFormat 注 解 ， 
如 下 所 示 : 


static class MyDate { 
@JsonFormat(pattern="yyyy-MM-dd HH:mm:ss", timezone="GMT+8") 
public Date date = new Date(); 


} 
加 注解 后 ， 输 出 变 为 如 下 所 示 : 


{"date":"2016-12-26 21:26:18"} 


8. 配 置 构造 方法 


前 面 的 Student 类 ， 如 来 没有 定义 默认 构造 方法 ， 只 有 如 下 构造 方 
* 


public Student(String name, int age, double score) { 
this.name = name,; 
this.age = age; 
this.score = score; 


则 反 序列 化 时 会 抛 异常 ， 提 示 找 不 到 合适 的 构造 方法 ， 可 以 使 用 
@JsonCreator 和 (@Json-Property 标 记 该 构造 方法 ， 如 下 所 示 : 


@JsonCreator 

public Student( 
@JsonProperty("'name") String name, 
@JsonProperty("age") int age, 
@JsonProperty("score") double score) { 


this.name = name; 
this.age = age,; 
this.score = score; 


上 
这 样 ， 反 序列 化 就 没有 问题 了 。 
14.5.6_。 Jackson 对 XML 支持 的 局 限 性 


需要 说 明 的 是 ， 对 于 XML 格式 ，Jackson 的 文 持 不 是 太 全 面 。 比 
如 ， 对 于 一 个 Map<String，List<String>> 对 象 ，Jackson 可 以 序列 化 ， 但 
不 能 反 序列 化 ， 如 下 所 示 : 


Map<String, List<String>> map = new HashMap<>(); 
map.put("hello", Arrays.asList(new String[]{" 老 马 ", "小 马 "})); 
ObjectMapper mapper = new XmlMapper(); 
String str = mapper .writeValueAsString(map); 
System.out.printin(str); 
Map<String, List<String>> map2 = mapper.readValue(str, 

new TypeReference<Map<String, List<String>>>() {}); 
System.out.printin(map2); 


在 反 序列 化 时 ， 代 码 会 抛 出 异常 ， 如 有 果 mapper 是 一 个 ObjectMapper 
对 象 ， 反 序列 化 就 没有 问题 。 如 果 Jackson 不 能 满足 需求 ， 可 以 考虑 其 
他 库 ， 如 XStream (http://x-stream.github.io/) 。 


14.5.7” 洲 结 


本 节 介 绍 了 如 何 使 用 Jackson 来 实现 JSON/XML/MessagePack 序 列 
化 。 使 用 方法 是 类 似 的 ， 主 要 是 创建 的 ObjectMapper 对 象 不 一 样 ， 很 多 
情况 下 ， 不 需要 做 额外 配置 ， 但 也 有 很 多 情况 ， 需 要 做 额外 配置 ， 配 
置 方式 主要 是 注解 ， 我 们 介绍 了 Jackson 中 的 很 多 典型 注解 ， 大 部 分 注 
解 适 用 于 所 有 格式 。 本 节 完 整 的 代码 在 github 上 ， 地 址 为 


https://github.com/swiftma/program-logic ， 位 于 包 shuo.laoma.file.c63 
下 。 


Jackson 还 支持 很 多 其 他 格式 ， 如 YAML 、AVRO 、Protobuf、Smile 
等 。Jackson 中 也 还 有 很 多 其 他 配置 和 注解 ， 用 得 相对 较 少 ， 限 于 篇 
幅 ， 我 们 就 不 介绍 了 。 


从 注解 的 用 法 ， 我 们 可 以 看 出 ， 它 也 是 一 种 神奇 的 特性 ， 它 类 似 
于 注释 ， 但 却 能 实 实 在 在 改变 程序 的 行为 ， 它 是 怎么 做 到 的 呢 ? 我 们 
暂且 搁置 这 个 问题 ， 留 待 到 第 22 章 介绍 。 


至 此 ， 关 于 文件 的 整个 内 容 台 介绍 完了 ， 从 下 一 章 开 始 ， 让 我 们 
一 起 探索 并 发 和 线程 的 世界 ! 


:第 15 章 
:第 16 章 
:第 17 章 
:第 18 章 
:第 19 章 


.第 20 章 


第 五 部 分 


并 发 基础 知识 
并 发 包 的 基石 


并 发 


第 15 草 ”并 发 基础 知识 


在 之 前 的 章节 中 ， 我 们 都 是 假设 程序 中 只 有 一 条 执行 流 ， 程 序 从 
main 方 法 的 第 一 条 语句 逐条 执行 直到 结束 。 从 本 章 开 始 ， 我 们 讨论 并 
发 ， 在 程序 中 创建 线程 来 启动 多 条 执行 流 。 并 发 和 线程 是 一 个 复杂 的 
话题 ， 在 本 章 中 ， 我 们 讨论 关于 并 发 和 线程 的 基础 知识 ， 具 体 来 说 ， 
分 为 4 个 小 和 : 15.1 市 介绍 关于 线程 的 一 些 基本 概念 15.2 太 介绍 线程 
间 安 全 竞争 同一 资源 的 机 制 : synchronized; 15.3 广 介绍 线程 则 的 基本 
协作 机 制 : waiynotify; 15.4 区 介绍 取消 /关闭 线程 的 机 制 : 中断。 


15.1 ”线程 的 基本 概念 


本 方 ， 我 们 介绍 Java 中 线程 的 一 些 基本 概念 ， 包 括 创建 线 程 、 线 
程 的 基本 属性 和 方法 、 共 至 内 存 及 问题 、 线 程 的 优点 及 成 本 。 


15.1.1 创建 线程 


线程 表示 一 条 单独 的 执行 沪 ， 它 有 和 上 自 己 的 程序 执行 计数 内， 有 目 
己 的 栈 。 下 面 ， 我 们 通过 创建 线程 来 对 线程 建立 一 个 直观 感受 。 在 
Java 中 创建 线程 有 两 种 方式 : 一 种 是 继承 Thread; 另外 一 种 是 实现 
Runnable 接 口 。 


1 .继承 Thread 


Java 中 java.lang.Thread 这 个 类 表示 线程 ， 一 个 类 可 以 继承 Thread 并 
重 写 其 run 方 法 来 实现 一 个 线程 ， 如 下 所 示 : 


public class HelloThread extends Thread { 
Q@Override 
public void run() { 
System.out.println("hello"); 


HelloThread 这 个 类 继承 了 Thread， 并 重 写 了 run 方 法 。run 方 法 的 
方法 签名 是 固定 的 ，public， 没 有 参数 ， 没 有 返回 值 ， 不 能 抛 出 受 检 腊 
和 常 。run 方 法 类 似 于 单线 程 程序 中 的 main 方 法 ， 线 程 从 run 方 法 的 第 一 
条 语句 开始 执行 直到 结束 。 


定义 了 这 个 类 不 代表 代码 就 会 开始 执行 ， 线 程 需要 被 启动 ， 局 动 
需要 先 创 建 一 个 HelloThread 对 象 ， 然 后 调用 Thread 的 start 方 法 ， 如 下 
所 示 : 


public static void main(String[] args) { 
Thread thread = new HelloThread(); 
thread. start(); 

} 


我 们 在 main 方 法 中 创建 了 一 个 线程 对 象 ， 并 调用 了 其 start 方 法 ， 
调用 start 方 法 后 ，HelloThread 的 run 方 法 就 会 开始 执行 ， 屏 幕 输 出 为 : 


hello 


为 什么 调用 的 是 start， 执 行 的 却 是 run 方 法 呢 ? start 表 示 局 动 该 线 
程 ， 使 其 成 为 一 条 单独 的 执行 流 ， 操 作 系 统 会 分 配 线程 相关 的 资源 ， 
每 个 线程 会 有 单独 的 程序 执行 计数 器 和 栈 ， 操 作 系 统 会 把 这 个 线程 作 
人 分 配 时 间 片 让 它 执 行 ， 执 行 的 起 点 就 是 
run 方 法 。 


如 果 不 调 用 start， 而 直接 调用 run 方 法 呢 ? 屏幕 的 输出 并 不 会 发 生 
变化 ， 但 并 不 会 局 动 一 条 单独 的 执行 流 ，run 方 法 的 代码 依然 是 在 main 
线程 中 执行 的 ，run 方 法 只 是 main 方 法 调用 的 一 个 普通 方法 。 怎 么 确认 
代码 是 在 哪个 线程 中 执行 的 呢 ? Thread 有 一 个 静态 方法 currentThread ， 
返回 当前 执行 的 线程 对 象 : 


public static native Thread currentThread(); 


每 个 Thread 都 有 一 个 id 和 name: 


public long getId() 
public final String getName() 


这 样 ， 我 们 就 可 以 判断 代码 是 在 哪个 线程 中 执行 的 。 修 改 
HelloThead 的 run 方 法 : 


Q@override 

public void run() { 
System,.out,println("thread name: 
System.out.println("hello"); 

} 


"+ Thread.currentThread().getName( )); 


如 果 在 main 方 法 中 通过 start 方 法 启动 线 程 ， 程 序 输出 为 : 


thread name: Thread-0 
hello 


如 有 果 在 main 方 法 中 直接 调用 run 方 法 ， 程 序 输出 为 : 


thread name: main 
hello 


调用 start 后 ， 就 有 了 两 条 执行 流 ， 新 的 一 条 执行 un 方法 ， 旧 的 一 
条 继续 执行 main 方 法 ， 两 条 执行 流 并 发 执行 ， 操 作 系 统 负 责 调度 ， 在 
单 CPU 的 机 恬 上 ， 同 一 时 刻 只 能 有 一 个 线程 在 执行 ， 在 多 CPU 的 机 器 
上 ， 同 一 时 刻 可 以 有 多 个 线程 同时 执行 ， 但 操作 系统 给 我 们 屏蔽 了 这 
种 差异 ， 给 程序 员 的 感觉 束 是 多 个 线程 并 发 执行 ， 但 哪 条 语句 先 执行 
哪 条 后 执行 是 不 一 定 的 。 当 所 有 线程 都 执行 完毕 的 时 候 ， 程 序 退 出 。 


2. 实 现 Runnable 接 口 

通过 继承 Thread 来 实现 线程 虽然 比较 简单 ， 但 Java 中 只 文 持 单 继 
其， 每 个 类 最 多 只 能 有 一 个 父 类 ， 如 采 类 已 经 有 父 类 了 ， 束 不 能 再 继 
承 Thread， 这 时 ， 可 以 通过 实现 java.lang.Runnable 接 口 来 实现 线程 。 
Runnable 接 口 的 定义 很 简单 ， 只 有 一 个 run 方 法 ， 如 下 所 示 : 


public interface Runnable { 
public abstract void run(); 
} 


一 个 类 可 以 实现 该 接口 ， 并 实现 run 方 法 ， 如 下 所 示 : 


public class HelloRunnable implements Runnable { 
QOverride 
public void run() 
System.out.println("hello"); 


仅仅 实现 Runnable 是 不 够 鸣 ， 要 局 动 线程 ， 还 是 要 创建 一 个 
Thread 对 象 ， 但 传递 一 个 Runnable 对 象 ， 如 下 所 示 : 


public static void main(String[] args) { 
Thread helloThread = new Thread(new HelloRunnable()); 
helloThread. start(); 

} 


无 论 是 通过 继承 Thead 还 是 实现 Runnable 接 口 来 创建 线程 ， 启 动 线 
程 都 是 调用 start 方 法 。 


15.1.2 ”线程 的 基本 属性 和 方法 


线程 有 一 些 基本 属性 和 方法 ， 包 括 id、name、 优 先 级 、 状 态 、 是 
否 daemo 线 程 、sleep 方 法 、yield 方 法 、join 方 法 、 过 时 方法 等 ， 我 们 人 简 
要 介绍 。 


1.id 和 name 


前 面 我 们 提 到 ， 每 个 线程 都 有 一 个 id 和 name。id 是 一 个 递增 的 整 
数 ， 每 创建 一 个 线程 就 加 一 。name 的 默认 值 是 Thread- 后 跟 一 个 编号 ， 
name 可 以 在 Thread 的 构造 方法 中 进行 指定 ， 也 可 以 通过 setName 方 法 进 
行 设 置 ， 给 Thread 设 置 一 个 友好 的 名 字 ， 可 以 方便 调试 。 


2. 优 先 级 


Sm 在 Java 中 ， 优 先 级 从 1 到 10， 默 认为 
5， 相 关 方 法 


public final void setPriority(int newPriority) 
public final int getPriority() 


这 个 优先 级 会 被 映 映 到 操作 系统 中 线程 的 优先 级 ， 不 过 ， 因 为 操 
作 系 统 各 不 相同 ， 不 一 定 都 是 10 个 优先 级 ，Java 中 不 同 的 优先 级 可 能 
会 被 映射 到 操作 系统 中 相同 的 优先 级 。 另 外 ， 优 先 级 对 操作 系统 而 言 
主要 是 一 种 建议 和 提示 ， 而 非 强 制 。 人 简单 地 说 ， 在 编程 中 ， 不 要 过 于 
依赖 优先 级 。 


3. 状 态 


机 线程 有 一 个 状态 的 概念 ，Thread 有 一 个 方法 用 于 获取 线程 的 状 


JU ， 


public State getState() 


返回 值 类 型 为 Thread.State， 它 是 一 个 枚 举 类 型 ， 有 如 下 值 : 


public enum State { 
NEW, 


RUNNABLE, 
BLOCKED, 
WAITING, 
TIMED_WAITING, 
TERMINATED ， 


关于 这 些 状 态 ， 我 们 简单 解释 下 : 

1) NEW: 没有 调用 start 的 线程 状态 为 NEW 。 

2) TERMINATED: 线程 运行 结束 后 状态 为 TERMINATED 。 

3) RUNNABLE: 调用 start 后 线程 在 执行 run 方 法 且 没 有 阻塞 时 状 
态 为 RUNNABLE， 不 过 ，RUNNABLE 不 代表 CPU 一 定 在 执行 该 线程 
的 代码 ， 可 能 正在 执行 也 可 能 在 等 待 操作 系统 分 配 时 间 片 ， 只 是 它 没 
有 在 等 待 其 他 条 件 。 


4) BLOCKED、WAITING、TIMED_ WAITING: 都 表示 线程 被 阻 
塞 了 ， 在 等 待 一 些 条 件 ， 其 中 的 区 别 我 们 在 后 续 章 和 再 介绍 。 


Thread 还 有 一 个 方法 ， 返 回 线程 是 否 活着 : 
public final native boolean isAlive() 
线程 补 局 动 后 ，run 方 法 运行 结束 前 ， 返 回 值 都 是 true 。 
4. 是 否 daemon 线 程 


Thread 有 一 个 是 否 daemon 线 程 的 属性 ， 相 关 方 法 是 : 


public final void setDaemon(boolean on) 
public final boolean isDaemon() 


前 面 我 们 提 到 ， 局 动 线程 会 局 动 一 条 单独 的 执行 流 ， 整 个 程序 只 
有 在 所 有 线程 都 结束 的 时 候 才 退出 ， 但 daemon 线 程 是 例外 ， 当 整个 程 
序 中 剩 下 的 都 是 daemon 线 程 的 时 候 ， 程 序 就 会 退出 。 


daemon 线 程 有 什么 用 呢 ? 它 一 般 是 其 他 线程 的 辅助 线程 ， 在 它 辅 
助 的 主线 程 退 出 的 时 候 ， 它 就 没有 存在 的 意义 了 。 在 我 们 运行 一 个 即 
使 最 简单 的 "hello world" 类 型 的 程序 时 ， 实 际 上 ，Java 也 会 创建 多 个 线 
程 ， 除 了 main 线 程 外 ， 至 少 还 有 一 个 负责 垃圾 回收 的 线程 ， 这 个 线程 
就 是 daemon 线 程 ， 在 main 线 程 结束 的 时 候 ， 垃 圾 回收 线程 也 会 退出 。 


5.sleep 方 法 


Thread 有 一 个 静态 的 sleep 方 法 ， 调 用 该 方法 会 让 当前 线程 睡眠 指 
定 的 时 间 ， 单 位 是 坚 秘 : 


public static native void sleep(long millis) throws InterruptedException; 


睡眠 期 间 ， 该 线程 会 让 出 CPU， 但 睡眠 的 时 间 不 一 定 是 确切 的 给 
定 宫 秒 数 ， 可 能 有 一 定 的 偏差 ， 偏 差 与 系统 定时 器 和 操作 系统 调度 履 
的 准确 度 和 精度 有 天。 睡眠 期 间 ， 线 程 可 以 被 中 断 ， 如 果 被 中 断 ， 
sleep 会 抛 出 PnterruptedException， 关 于 中 上 断 以 及 中 断 处理 ， 我 们 在 15.4 


节 介 绍 。 
6.yield 方 法 
Thread 下 有 一 个 让 出 CPU 的 方法 : 


public static native void yield(); 


这 也 是 一 个 静态 方法 ， 调 用 该 方法 ， 征 告诉 操作 系统 的 调度 坷 : 
我 现在 不 着 急 占 用 CPU， 你 可 以 先 让 其 他 线程 运行 。 不 过 ， 这 对 调度 
es 调度 器 如 何 处 理 是 不 一 定 的 ， 它 可 能 完全 忽略 该 调 


7.join 方 法 


在 前 面 HelloThread 的 例子 中 ，HelloThread 没 执行 完 ，main 线 程 可 


能 就 执行 完了 ，Thread 有 一 个 join 方 法 ， 可 以 让 调用 join 的 线程 等 待 该 
线程 结束 ，join 方 法 的 声明 为 : 


public final void join() throws InterruptedException 


在 等 待 线程 结束 的 过 程 中 ， 这 个 等 竺 可 能 被 中 断 ， 如 采 被 中 断 ， 


会 抛 出 Interrupted-Exception 。 


秒 ， 


join 方 法 还 有 一 个 变 体 ， 可 以 限定 等 竺 的 最 长 时 间 ， 单 位 为 电 
如 果 为 0， 表 示 无 期 限 等 行 : 


public final synchronized void join(long millis) throws InterruptedException 


在 前 面 HelloThread 示 例 中 ， 如 果 和 希望 main 线 程 在 子 线程 结束 后 再 


退出 ，main 方 法 可 以 改 为 : 


public static void main(String[] args) throws InterruptedException { 
Thread thread = new HelloThread(); 
thread. start(); 
thread.join(); 


} 
8. 过 时 方法 


Thread 类 中 还 有 一 些 看 上 去 可 以 控制 线程 生命 周期 的 方法 ， 如 : 


public final void stop() 
public final void suspend() 
public final void resume() 


这 些 方 法 因为 各 种 原因 已 被 标记 为 了 过 时 ， 我 们 不 应 该 在 程序 中 


使 用 信人 a 


15.1.3” 共 至 内 存 及 可 能 存在 的 问题 


前 面 我 们 提 到 ， 每 个 线程 表示 一 条 单独 的 执行 流 ， 有 目 己 的 程序 
计数 右 ， 有 目 己 的 栈 ， 但 线程 之 间 可 以 共 至 内 存 ， 它 们 可 以 访问 和 操 
作 相 同 的 对 象 。 我 们 看 个 例子 ， 如 代码 清单 15-1 所 示 。 


代码 清单 15-1 共享 内 存 示例 


public class ShareMemoryDemo { 
private static int shared = 0; 
private static void incrShared(){ 
Shared ++; 


static class ChildThread extends Thread { 
List<String> list; 
public ChildThread(List<String> list) { 
this,.list = list; 


QOverride 

public void run() { 
incrShared(); 
list.add(Thread.currentThread( ).getName()); 


} 


public static void main(String[] args) throws InterruptedException { 
List<String> list = new ArrayList<String>(); 
Thread t1 = new ChildThread(1ist); 
Thread t2 = new ChildThread(1ist); 
t1,Start()， 
t2.start(); 
t1.join(); 
t2.join(); 
System,.out.printlin(shared); 
System.out.println(1list),; 


在 代码 中 ， 定 义 了 一 个 静态 变量 shared 和 静态 内 部 类 
ChildThread， 在 main 方 法 中 ， 创 建 并 启动 了 两 个 ChildThread 对 象 ， 传 
递 了 相同 的 list 对 象 ，ChildThread 的 run 方 法 访问 了 共享 的 变量 shared 和 
list，main 方 法 最 后 输出 了 共享 的 shared 和 list 的 值 ， 大 部 分 情况 下 ， 会 
输出 期 望 的 值 : 


2 
[Thread-0, Thread-1] 


通过 这 个 例子 ， 我 们 想 强调 说 明 执行 流 、 内 存 和 程序 代码 之 间 的 


oO 
sq ™ 


1) 该 例 中 有 三 条 执行 流 ， 一 条 执行 main 方 法 ， 另 外 两 条 执行 
ChildThread 的 run 方 法 。 


2) 不 同 执行 流 可 以 访问 和 操作 相同 的 变量 ， 如 本 例 中 的 shared 和 
list 变 量 。 

3) 不 同 执行 流 可 以 执行 相同 的 程序 代码 ， 如 本 例 中 incrShared 方 
法 ，ChildThread 的 run 方 法 ， 被 两 条 ChildThread 执 行 流 执行 ， 
incrShared 方 法 是 在 外 部 定义 的 ， 但 被 ChildThread 的 执行 流 执行 。 在 分 
析 代 码 执行 过 程 时 ， 理 解 代 码 在 被 哪个 线程 执行 是 很 重要 的 。 


4) 当 多 条 执行 流 执行 相同 的 程序 代码 时 ， 每 条 执行 流 都 有 单独 的 
栈 ， 方 法 中 的 参数 和 局 部 变量 都 有 目 己 的 一 份 。 


当 多 条 执行 流 可 以 操作 相同 的 变量 时 ， 可 能 会 出 现 一 些 意料 之 外 
的 结果 ， 包 括 范 态 条 件 和 内 存 可 见 性 问题 ， 我 们 来 看 下 。 


1. 竞 态 条 件 

所 谓 竞 态 条 件 (race condition) 是 指 ， 当 多 个 线程 访问 和 操作 同 
一 个 对 象 时 ， 最 终 执行 结果 与 执行 时 序 有 关 ， 可 能 正确 也 可 能 不 正 
确 。 我 们 看 一 个 例子 ， 如 代码 清单 15-2 所 示 。 


代码 清单 15-2” 竞 态 条 件 示例 


public class CounterThread extends Thread { 
private static int counter = 0; 
Q@Override 
public void run() 
for(int i = 0; i < 1000; i++) { 
counter++; 


} 


} 
public static void main(String[] args) throws InterruptedException { 
int num = 1000; 
Thread[] threads = new Thread[num]; 
for(int i = 0; i < num; i++) { 
threads[i] = new CounterThread(); 
threads[i].start(); 


for(int i = 0; i < num; i++) { 


threads[i].join(); 


System.out.println(counter); 


这 上 段 代 码 容 易 理 解 ， 有 一 个 共享 静态 变量 counter， 初 始 值 为 0， 在 
main 方 法 中 创建 了 1000 个 线程 ， 每 个 线程 对 counter 循 环 加 1000 次 ， 
main 线 程 等 待 所 有 线程 结束 后 输出 counter 的 值 。 

期 望 的 结果 是 100 万 ， 但 实际 执行 ， 发 现 每 次 输出 的 结果 都 不 一 
样 ， 一 般 都 不 是 100 万 ， 经 常 是 99 万 多 。 为 什么 会 这 样 呢 ? 因为 
counter++ 这 个 操作 不 是 原子 操作 ， 它 分 为 三 个 步骤 : 

1) 取 counter 的 当前 值 ; 

2) 在 当前 值 基础 上 加 1; 

3) 将 新 值 重 新 赋值 给 counter 。 

两 个 线程 可 能 同时 执行 第 一 步 ， 取 到 了 相同 的 counter 值 ， 比 如 都 
取 到 了 100， 第 一 个 线程 执行 完 后 counter 变 为 101， 而 第 二 个 线程 执行 
完 后 还 是 101， 最 终 的 结果 了 吏 与 期 望 不 符 。 

怎么 解决 这 个 问题 呢 ? 有 多 种 方法 : 

-使 用 synchronized 关 键 字 ; 

.使 用 显 式 锁 ; 

.使 用 原子 变量 。 

关于 这 些 方法 ， 我 们 在 后 续 章 和 会 逐步 介绍 。 

2. 内 存 可 见 性 
多 个 线程 可 以 共享 访问 和 操作 相同 的 变量 ， 但 一 个 线程 对 一 个 共 


译 变 量 的 修改 ， 男 一 个 线程 不 一 定 马 上 就 能 看 到 ， 甚 至 永远 也 看 不 
到 。 这 可 能 有 人 悖 直觉 ， 我 们 来 看 一 个 例子 ， 如 代码 清单 15-3 所 示 。 


代码 清单 15-3 ”内 存 可 见 性 示例 


public class VisibilityDemo { 
private static boolean shutdown = false; 
static class HelloThread extends Thread { 
Q@Override 
public void run() { 
while(!shutdown){ 
// do nothing 


} 
System.out.println("exit hello"),; 


} 

public static void main(String[] args) throws InterruptedException { 
new HelloThread().start(); 
Thread.sleep(1000); 
shutdown = true,; 
System.out.printjn("exit main"); 

} 

} 


在 这 个 程序 中 ， 有 一 个 共享 的 boolean 变 量 shutdown， 初 始 为 
false，HelloThread 在 shutdown 丰 为 true 的 情况 下 一 直 死 循环 ， 当 
shutdown 为 true 时 退出 并 输出 "exit hello"，main 线 程 启 动 HelloThread 后 
休息 了 一 会 儿 ， 然 后 设置 shutdown 为 trtue， 最 后 输出 "exit main" 。 


期 望 的 结 采 是 两 个 线程 都 退 出 ， 但 实际 执行 时 ， 很 可 能 会 发 现 
HelloThread 永 远 都 不 会 退出 ， 也 束 是 说 ， 在 HelloThread 执 行 流 看 来 ， 
shutdown 永 远 为 false， 即 使 main 线 程 已 经 更 改 为 了 true。 


这 是 怎么 回 事 呢 ?这 就 是 内 存 可 见 性 问题 。 在 计算 机 系统 中 ， 除 
了 内 存 ， 数 据 还 会 被 缓存 在 CPU 的 寄存 右 以 及 各 级 缓存 中 ， 当 访问 一 
个 变量 时 ， 可 能 直接 从 寄存 器 或 CPU 缓存 中 获取 ， 而 不 一 定 到 内 存 中 
去 取 ， 当 修改 一 个 要 量 时 ， 也 可 能 是 先 写 到 缓存 中 ， 稍 后 才 会 同步 更 
新 到 内 存 中 。 在 单线 程 的 程序 中 ， 这 一 般 不 是 问题 ， 但 在 多 线程 的 程 
序 中 ， 尤 其 是 在 有 多 CPU 的 情况 下 ， 这 就 是 闫 重 的 问题 。 一 个 线程 对 
内 存 的 修改 ， 另 一 个 线程 看 不 到 ， 一 是 修改 没有 及 时 同步 到 内 存 ， 二 
征 另 一 个 线程 根本 束 没 从 内 存 读 。 


怎么 解决 这 个 问题 呢 ? 有 多 种 方法 : 
.使 用 volatile 关 键 字 。 
.使 用 Synchronized 天 键 字 或 显 式 锁 同 步 。 


关于 这 些 方法 ， 我 们 在 后 续 章 节 会 逐步 介绍 。 
15.1.4 ”线程 的 优点 及 成 本 


为 什么 要 创建 单独 的 执行 流 ? 或 者 说 线程 有 什么 优点 呢 ? 至 少 有 
DE /me 


1) 充分 利用 多 CPU 的 计算 能 力 ， 单 线程 只 能 利用 一 个 CPU， 使 用 
多 线程 可 以 利用 多 CPU 的 计算 能 力 。 


2) 充分 利用 硬件 资源 ，CPU 和 硬盘 、 网 络 是 可 以 同时 工作 的 ， 一 
个 线程 在 等 竺 网 络 IO 的 同时 ， 另 一 个 线程 完全 可 以 利用 CPU， 对 于 多 
个 独立 的 网 络 请 求 ， 完 全 可 以 使 用 多 个 线程 同时 请 求 。 


3) 在 用 户 界面 (GUI) 应 用 程序 中 ， 保 持 程 序 的 响应 性 ， 界 面 和 
台 任 务 通 党 是 不 同 的 线程 ， 否 则 ， 如 果 所 有 事情 都 是 一 个 线程 来 执 
当 执 行 一 个 很 慢 的 任务 时 ， 整 个 界面 将 停止 啊 应 ， 也 无 法 取消 该 


人 
务 。 
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4) 简化 建 模 及 IO 处 理 ， 比 如 ， 在 服务 器 应 用 程序 中 ， 对 每 个 用 
户 请 求 使 用 一 个 单独 的 线程 进行 处 理 ， 相 比 使 用 一 个 线程 ， 处 理 来 自 
容易 得 多 。 


天 于 线程 ， 我 们 需要 知道 ， 它 是 有 成 本 的 。 创 建 线程 需要 消耗 操 
作 系 统 的 资源 ， 操 作 系统 会 为 每 个 线程 创建 必要 的 数据 结构 、 栈 、 程 
序 计数 絮 等 ， 创 建 也 需要 一 定 的 时 间 。 


此 外 ， 线 程 调度 和 切换 也 是 有 成 本 的 ， 当 有 大 量 可 运行 线程 的 时 
候 ， 操 作 系 统 会 忙于 调度 ， 为 一 个 线程 分 配 一 段 时 间 ， 执 行 完 后 ， 再 
让 另 一 个 线程 执行 ， 一 个 线程 被 切换 出 去 后 ， 操 作 系统 需要 保存 它 的 
当前 上 下 文 状态 到 内 存 ， 上 下 文 状态 包括 当前 CPU 寄 存 紫 的 值 、 程 序 
计数 右 的 值 等 ， 而 一 个 线程 被 切换 回来 后 ， 操 作 系 统 需 要 恢复 它 原来 
的 上 下 文 状态 ， 整 个 过 程 称 为 上 下 文 切换 ， 这 个 切换 不 仅 耗 时 ， 而 且 
使 CPU 中 的 很 多 缓存 失效 。 


当然 ， 这 些 成 本 是 相对 而 言 的 ， 如 果 线 程 中 实际 执行 的 事情 比较 
多 ， 这 些 成 本 是 可 以 接受 的 ， 但 如 果 只 是 执行 本 市 示例 中 的 
counter++， 那 相对 成 本 束 太 高 了 。 

另外 ， 如 果 执 行 的 任务 都 是 CPU 密集 型 的 ， 即 主要 消耗 的 都 是 
那 创 建 超 过 CPU 数量 的 线程 承 是 没有 必要 的 ， 并 不 会 加 快 程序 
执行 。 


15.2 ”理解 synchronized 


上 一 节 ， 我 们 提 到 ， 共 享 内 存 有 两 个 重要 问题 ， 一 个 是 竞 态 条 
件 ， 另 一 个 是 内 存 可 见 性 ， 解 决 这 两 个 问题 的 一 个 方案 是 使 用 
synchronized 天 键 字 ， 本 市 就 来 讨论 这 个 关键 字 。 我 们 先 来 了 解 
synchronized 的 用 法 和 基本 原理 ， 然 后 再 从 多 个 角度 进一步 理解 ， 最 后 
介绍 使 用 synchronized 实 现 的 同步 容器 及 其 注意 事项 。 


15.2.1 用 法 和 基本 原理 
synchronized 可 以 用 于 修饰 类 的 实例 方法 、 议 态 方 法 和 代码 块 ， 我 


们 分 别 介绍 。 
1. 实 例 方 法 


上 市 我 们 介绍 了 一 个 计数 的 例子 ， 当 多 个 线程 并 发 执行 
counter++ 的 时 候 ， 由 于 该 语句 不 是 原子 操作 ， 出 现 了 意料 之 外 的 结 
果 ， 这 个 问题 可 以 用 synchronized 解 决 ， 如 代码 清单 15-4 所 示 。 


代码 清单 15-4 ”用 synchronized 修 饰 的 Counter 类 


public class Counter { 
private int count,; 
public synchronized void incr(){ 
count ++; 


} 
public synchronized int getCount() { 
return count; 
} 
} 


Counter 是 一 个 简单 的 计数 妖 类 ，incr 方 法 和 getCount 方 法 都 加 了 
synchronized 修 饰 。 加 了 synchronized 后 ， 方 法 内 的 代码 就 变 成 了 原子 操 
作 ， 当 多 个 线程 并 发 更 新 同一 个 Counter 对 象 的 时 候 ， 也 不 会 出 现 问 
题 。 使 用 的 代码 如 代码 清单 15-5 所 示 。 


代码 清单 15-5 ”多 线程 访问 synchronized 保 护 的 Counter 对 象 


public class CounterThread extends Thread { 
Counter counter; 
public CounterThread(Counter counter) { 
this.counter = counter,; 


Q@Override 
public void run() { 
for(int i = 0; i < 1000; i++) { 
counter .incr(); 


public static void main(String[] args) throws InterruptedException { 
int num = 1000; 
Counter counter = new Counter(); 
Thread[] threads = new Thread[num]; 
for(int i = 0; i < num; i++) { 
threads[i] = new CounterThread(counter); 
threads[i].start(); 


for (int i = 0; i < num; i++) { 


threads[i].join(); 


System.out.printin(counter.getCount()); 


与 上 节 类 似 ， 我 们 创建 了 1000 个 线程 ， 传 递 了 相同 的 counter 对 
象 ， 每 个 线程 主要 就 ee main 线 程 等 待 子 
站 百 输 出 counter 的 值 ， 这 次 ， 不 论 运行 多 少 次 ， 结 果 都 是 正确 
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这 里 ， synchronized 到 帮 做 了 什么 呢 ? 看 上 去 ，synchronized 使 得 同 
时 只 能 有 一 个 线程 执行 实例 方法 ， 但 这 个 理解 是 不 确切 的 。 多 个 线程 
是 可 以 同时 执行 同一 Nsynchronized 实 例 方 法 的 ， 只 要 它们 访问 的 对 象 
是 不 同 的 即 可 ， 比如 : 


Counter counter1 = new Counter(); 
Counter counter2 = new Counter(); 

Thread t1 = new CounterThread(counter1); 
Thread t2 = new CounterThread(counter2 ) ; 
t1,.Start()， 

t2.Start()， 


这 里 ，tL 和 蕊 两 个 线程 是 可 以 同时 执行 Counter 的 incr 方 法 的 ， 因 为 
它们 访问 的 是 不 同 的 Counter 对 象 ， 一 个 是 counter1， 另 一 个 是 
counter2 ° 


所 以 ，synchronized 实 例 方 法 实际 保护 的 是 同一 个 对 象 的 方法 调 
用 ， 确 保 同 时 只 能 有 一 个 线程 执行 。 再 具体 来 说 ，synchronized 实 例 方 
法 保护 的 是 当前 实例 对 象 ， 即 this，this 对 象 有 一 个 锁 和 一 个 等 待 队 
列 ， 锁 只 能 被 一 个 线程 持 有 ， 其 他 试图 获得 同样 锁 的 线程 需要 等 待 。 
执行 synchronized 实 例 方 法 的 过 程 大 致 如 下 : 


1) 尝试 获得 锁 ， 如 果 能 够 获得 锁 ， 继 续 下 一 步 ， 否 则 加 入 等 待 队 
列 ， 阻 塞 并 等 待 唤醒 。 


2) 执行 实例 方法 体 代 码 。 


3) 释放 锁 ， 如 果 等 待 队 列 上 有 等 待 的 线程 ， 从 中 取 一 个 并 唤醒 ， 
如 东 有 多 个 等 生 的 线程 ， 唤 醒 哪 一 个 是 不 一 定 的 ， 不 傈 证 公平 性 。 


synchronized 的 实际 执行 过 程 比 这 要 复杂 得 多 ， 而 且 Java 虚 拟 机 采 
ee 但 从 概念 上 ， 我 们 可 以 这 么 简单 理 
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当前 线程 不 能 获得 锁 的 时 候 ， 它 会 加 入 等 待 队 列 等 待 ， 线 程 的 状 
态 会 变 为 BLOCKED 。 


我 们 再 强调 下 ，synchronized 保 护 的 是 对 象 而 非 代码 ， 只 要 访问 的 
是 同一 个 对 象 的 synchronized 方 法 ， 即 使 是 不 同 的 代码 ， 也 会 被 同步 顺 
友 访 问 。 比 如 ， 对 于 Counter 中 的 两 个 实例 方法 getCount 和 incr， 对 同一 
个 Counter 对 象 ， 一 个 线程 执行 fgetCount， 男 一 个 执行 incr， 它 们 是 不 能 
同时 执行 的 ， 会 被 synchronized 同 步 顺 序 执行 。 


此 外 ， 需 要 说 明 的 是 ，synchronized 方 法 不 能 防止 非 synchronized 方 
法 被 同时 执行 。 比 如 ， 如 果 给 Counter 类 增加 一 个 非 synchronized 方 法 : 


public void decr(){ 
count --; 


则 该 方法 可 以 和 synchronized 的 incr 方 法 同时 执行 ， 这 通常 会 出 现 
非 期 望 的 结果 ， 所 以 ， 一 般 在 保护 变量 时 ， 需 要 在 所 有 访问 该 变量 的 
方法 上 加 上 synchronized 。 


2. 静 仿 方法 


synchronized 同 样 可 以 用 于 静态 方法 ， 如 代码 清单 15-6 所 示 。 


代码 清单 15-6 ”synchronized 修 饰 静态 方法 


public class StaticCounter f{ 
private static int count = 0; 
public static synchronized void incr() { 
count++; 
} 


public static synchronized int getCount() { 
return count ， 
} 


前 面 我 们 说 ，synchronized 保 护 的 是 对 象 ， 对 实例 方法 ， 保 护 的 是 
当前 实例 对 象 this， 对 静态 方法 ， 保 护 的 是 哪个 对 象 呢 ?是 类 对 象 ， 这 
里 是 StaticCounter.class。 实 际 上 ， 每 个 对 象 都 有 一 个 锁 和 一 个 等 待 队 
列 ， 类 对 象 也 不 例外 。 


synchronized 静 态 方法 和 synchronized 实 例 方 法 保护 的 是 不 同 的 对 
象 ， 不 同 的 两 个 线程 ， 可 以 一 个 执行 synchronized 静 态 方 法 ， 另 一 个 执 
行 synchronized 实 例 方法 。 


3. 代 码 块 


除了 用 于 修饰 方法 外 ，synchronized 还 可 以 用 于 包装 代码 块 ， 比 如 
对 于 代码 清单 15-4 的 Counter 类 ， 等 价 的 代码 如 代码 清单 15-7 所 示 。 


代码 清单 15-7 ”synchronized 代 码 块 修饰 的 Counter 类 


public class Counter { 
private int count,; 
public void incr(){ 
synchronized(this)t{ 


count ++; 
} 
} 
public int getCount() { 
Synchronized(this){ 
return count; 
} 
} 


} 


synchronized 括 号 里 面 的 就 是 保护 的 对 象 ， 对 于 实例 方法 ， 就 是 
this，{} 里 面 是 同步 执行 的 代码 。 对 于 前 面 的 StaticCounter 类 ， 等 价 的 
代码 如 代码 清单 15-8 所 示 。 


代码 清单 15-8 ”synchronized 代 码 块 修饰 的 StaticCounter 类 


public class StaticCounter { 
private static int count = 0; 
public static void incr() { 
synchronized(StaticCounter.class)t{ 
count++; 


} 
public static int getCount() { 
synchronized(StaticCounter.class)t{ 
return count ， 
} 


} 
} 


synchronized 同 步 的 对 象 可 以 是 任意 对 象 ， 任 意 对 象 都 有 一 个 锁 和 
等 待 队列 ， 或 者 说 ， 任 何 对 象 都 可 以 作为 锁 对 象 。 比 如 ，Counter 类 的 
等 价 代码 还 可 以 如 代码 清单 15-9 所 示 。 


代码 清单 15-9 ”使 用 单独 对 象 作 为 锁 的 Counter 类 


public class Counter { 
private int count,; 
private Object lock = new Object(); 
public void incr(){ 
synchronized(lock){ 
count ++; 
} 


} 
public int getCount() { 
synchronized(lock){ 
return count ， 
} 


} 
} 


15.2.2 ”进一步 理解 synchronized 
Sy ne el 法 和 原理 之 后 ， 我 们 再 从 下 面 儿 个 角 
度 来 进一步 介 绍 syn-chronized: 


.可 重 入 性 。 
内存 可 见 性 。 
死 锁 。 

1. 可 重 入 性 


synchronized 有 一 个 重要 的 特征 ， 它 是 可 重 入 的 ， 也 就 是 说 ， 对 同 
一 个 执行 线程 ， 它 在 获得 了 锁 之 后 ， 在 调用 其 他 需要 同样 锁 的 代码 
时 ， 可 以 直接 调用 。 比 如 ， 在 一 个 syn-chronized 实 例 方法 内 ， 可 以 直接 
调用 其 他 synchronized 实 例 方 法 。 可 重 入 是 一 个 非常 目 然 的 属性 ， 应 该 
是 很 容易 理解 的 ， 之 所 以 强调 ， 是 因为 并 不 是 所 有 锁 都 是 可 重 入 的 ， 
后 续 章 节 我 们 会 看 到 不 可 重 入 的 锁 。 


可 重 入 是 通过 记录 锁 的 持 有 线程 和 持 有 数量 来 实现 的 ， 当 调用 被 
synchronized 保 护 的 代码 上 时， 检查 对 象 是 否 已 被 馈 ， 如 果 是 ， 再 检查 是 
否 被 当前 线程 锁定 ， 如 果 是 ， 增 加 持 有 数量 ， 如 采 不 是 被 当前 线程 锁 
定 ， 才 加 入 等 竺 队列 ， 当 释放 锁 时 ， 减 少 持 有 数量 ， 当 数量 变 为 0 时 才 
释放 整个 锁 。 

2. 内 存 可 见 性 

对 于 复杂 一 些 的 操作 ，synchronized 可 以 实现 原子 操作 ， 避 人 免 出 现 

竞 态 条 件 ， 但 对 于 明显 的 本 来 就 是 原子 的 操作 方法 ， 也 需要 加 


synchronized 吗 ? 比如 ， 下 面 的 开关 类 Switcher 只 有 一 个 boolean 变 量 on 
和 对 应 的 settergetter 方 法 : 


public class Switcher { 
private boolean on; 
public boolean isOn() { 
return on; 
} 
public void seton(boolean on) { 
this.on = on; 
} 
} 


当 多 线程 同时 访问 同一 个 Switcher 对 象 时 ， 会 有 问题 吗 ? 没有 疯 态 
条 件 问题 ， 但 正如 上 市 所 说 ， 有 内 存 可 见 性 问题 ， 而 加 上 synchronized 
可 以 解决 这 个 问题 。 


synchronized 除 了 保证 原子 操作 外 ， 它 还 有 一 个 重要 的 作用 ， 束 古 
傈 证 内 存 可 见 性 ， 在 释放 锁 时 ， 所 有 写 入 都 会 写 回 内 存 ， 而 获得 锁 
后 ， 都 会 从 内 存 中 读 最 新 数据 。 


不 过 ， 如 果 只 是 为 了 保证 内 存 可 见 性 ， 使 用 synchronized 的 成 本 有 
Du 有 一 个 更 轻 量 级 的 方式 ， 那 束 是 给 变量 加 修饰 从 volatile， 如 下 
Zs: 


public class Switcher { 
private volatile boolean on,; 
public boolean isOn() { 
return on; 


public void seton(boolean on) { 
this.on = on; 
} 
} 


加 了 volatile 之 后 ，Java 会 在 操作 对 应 变量 时 插入 特殊 的 指令 ， 保 证 
读 写 到 内 存 最 新 值 ， 而 非 缓存 的 值 。 


3. 死 锁 


使 用 synchronized 或 者 其 他 锁 ， 要 注意 死 锁 。 所 谓 死 锁 就 是 类 似 这 
种 现象 ， 比 如 ， 有 a、b 两 个 线程 ，a 持 有 锁 A， 在 等 待 锁 B， 而 b 持 有 锁 
B， 在 等 待 锁 A，a 和 b 陷 入 了 互相 等 待 ， 最 后 谁 都 执行 不 下 去 ， 如 代码 
清单 15-10 所 示 。 


代码 清 蛙 15-10” 死 锁 示 例 


public class DeadLockDemo { 
private static Object lockA = new Object(); 
private static Object lockB = new Object(); 
private static void startThreadA() { 
Thread aThread = new Thread() { 
@Override 
public void run() { 
synchronized (lockA) { 
try { 
Thread.sleep(1000); 
} catch (InterruptedException e) { 


} 
synchronized (lockB) { 


}; 
aThread. start(); 
} 
private static void startThreadB() { 
Thread bThread = new Thread() { 
Q@Override 
public void run() { 
synchronized (lockB) { 
try { 
Thread.sleep(1000); 
} catch (InterruptedException e) { 
} 


synchronized (lockA) { 
} 


} 
} 


}; 
bThread. start(); 


} 
public static void main(String[] args) { 
startThreadA( ); 
StartThreadB( ) ， 
} 
} 


运行 后 aThread 和 bThread 陷 入 了 相互 等 待 。 怎 么 解决 呢 ? 首先， 应 
该 尽量 避免 在 持 有 一 个 锁 的 同时 去 申请 另 一 个 锁 ， 如 果 人 确实 需要 多 个 
锁 ， 所 有 代码 都 应 该 按照 相同 的 顺序 去 申请 锁 。 比 如， 对 于 上 面 的 例 
子 ， 可 以 约定 都 先 申 请 lockA， 再 申请 lockB 。 


不 过 ， 在 复杂 的 项 目 代码 中 ， 这 种 约定 可 能 难以 做 到 。 还 有 一 种 
方法 是 使 用 后 续 革 节 介 绍 的 显 式 锁 接 口 Lock， 它 文 持 演 试 获取 锁 
(tryLock) 和 带 时 间 限 制 的 获取 锁 方 法 ， 使 用 这 些 方法 可 以 在 获取 不 
| 的 锁 ， 然 后 再 次 和 试 获取 锁 或 干脆 放弃 ， 以 
避免 死 锁 。 


如 果 还 是 出 现 了 死 锁 ， 怎 么 办 呢 ? Java 不 会 主动 处 理 ， 不 过 ， 借 助 
一 些 工 具 ， 我 们 可 以 发 现 运 行 中 的 死 锁 ， 比 如 ，Java 目 带 的 jstack 命 令 
会 报告 发 现 的 死 锁 。 对 于 上 面 的 程序 ， 在 笔者 的 计算 机 中 ，jstack 会 生 
成 图 15-1 所 示 的 报告 。 


15.2.3 ”同步 容器 及 其 注意 事项 


我 们 知道 ， 类 Collection 中 有 一 些 方法 ， 可 以 返回 线程 安全 的 同步 
容器 ， 比 如 : 


public static <T> Collection<T> synchronizedCollection(Collection<T> c) 
public static <T> List<T> synchronizedList(List<T> list) 
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) 


Found one Java-level deadlock: 


"Thread-1": 
waiting to lock monitor 0x00007ff95102d368 (object 0x00000007d56693f0，a java.lang.0bject), 
which is held by "Thread-0" 

"Thread-0": 
waiting to lock monitor 0x00007ff951602e758 (object 90x00000007d5669400，a java.lang.0bject), 
which is held by "Thread-1" 


Java stack information for the threads listed above: 


"Thread-1": 
at shuo.laoma.concurrent.c66.DeadLockDemo$2.run(DeadLockDemo. java:34) 
- waiting to Lock <0x00000007d56693fo> (a java. lang.0bject) 
- locked <0x00000007d5669400> (a java,Lang,0bject) 

"Thread-0": 
at shuo.laoma.concurrent.c66.DeadLockDemo$1,.run(DeadLockDemo.java:17) 
-~ waiting to lock <0x00000007d5669400> (a java. lang.0bject) 
—- locked <0x00000007d56693f0> (a java,Lang.0bject) 


Found 1 deadlock. 


图 15-1 jstack 的 死 锁 检 测 


下 比如 
Synchronized-Collection， 其 部 分 代码 如 下 所 示 : 


static class SynchronizedCollection<E> implements Collection<E> { 
final Collection<E> c; //Backing Collection 


final Object mutex; //Object on which to synchronize 
SynchronizedCollection(Collection<E> c) { 
if(c==null) 


throw new NullPpointerException(); 
this.c = c; 
mutex = this; 


public int size() { 
synchronized (mutex) {return c.size();} 


} 
public boolean add(E e) { 
synchronized (mutex) {return c.add(e);} 


public boolean remove(Object 0) { 
synchronized (mutex) {return c.remove(o);} 
} 


//... 


这 里 线程 安全 针对 的 是 容器 对 象 ， 指 的 是 当 多 个 线程 并 发 访问 同 
一 个 容器 对 象 时 ， 不 需要 额外 的 同步 操作 ， 也 不 会 出 现 错误 的 结果 。 


加 了 synchronized， 所 有 方法 调用 变 成 了 原子 操作 ， 客 尸 剖 在 调用 
时 ， 是 不 是 就 绝对 安全 了 呢 ? 不 是 的 ， 至 少 有 以 下 情况 需要 注意 : 


.复合 操作 ， 比 如 先 检查 再 更 新 。 
伪 同 步 。 
人 
我 们 分 别 介绍 。 
1. 复 合 操 作 
先 来 看 复合 操作 ， 我 们 看 段 代码 : 


public class EnhancedMap <K, V> { 
Map<K, V> map; 
public EnhancedMap(Map<K,V> map)t{ 
this.map = Collections.synchronizedMap(map); 


} 
public V putIfAbsent(K key, V value){ 
V old = map.get(key); 
if(old!=nul1){ 
return old; 


return map.put(key, value); 


} 
public V put(K key, V value)t{ 
return map.put(key, value); 


} 
js 


EnhancedMap 是 一 个 装饰 类 ， 接 受 一 个 Map 对 象 ， 调 用 
synchronizedMap 转 换 为 了 同步 容器 对 象 map， 增 加 了 一 个 方法 
putIfAbsent， 该 方法 只 有 在 原 Map 中 没有 对 应 键 的 时 候 才 添加 (在 Java 
8 之 后 ，Map 接 口 增加 了 putIfAbsent 默 认 方 法 ， 这 是 针对 Java 8 之 前 的 
Map 接 口 演 示 概 念 ) 。 


map 的 每 个 方法 都 是 安全 的 ， 但 这 个 复合 方法 putIfAbsent 是 安全 的 
吗 ? 显然 是 否定 的 ， 这 是 一 个 检查 然后 再 更 新 的 复合 操作 ， 在 多 线程 
的 情况 下 ， 可 能 有 多 个 线程 都 执行 完了 检查 这 一 步 ， 都 发 现 Map 中 没有 
人 的 键 ， 然 后 就 会 都 调用 put， 这 束 破 坏 了 putIf-Absent 方 法 期 望 保持 
A 语 义 o 


2. 伪 同步 


那 给 该 方法 加 上 synchronized 就 能 实现 安全 吗 ? 如 下 所 示 : 


public synchronized V putIfAbsent(K key, V Value){ 
V old = map.get(key); 
if(old!=null1)f{ 
return old; 


return map.put(key, value); 


} 


答案 是 否定 的 ! 为 什么 呢 ? 同步 鲁 对 象 了 。 putIfAbsent 同 步 使 用 
的 是 EnhancedMap 对 象 ， 而 其 他 方法 (如 代码 中 的 put 方 法 ) 使 用 的 是 
Collections.synchronizedMap 返 回 的 对 象 map， 两 者 是 不 同 的 对 象 。 要 解 
决 这 个 问题 ， 所 有 方法 必须 使 用 相同 的 富 ， 可 以 使 用 EnhancedMap 的 
对 象 锁 ， 也 可 以 使 用 map。 使 用 EnhancedMap 对 和 象 作 为 锁 ， 则 Enhanced- 
Map 中 的 所 有 方法 都 需要 加 上 synchronized。 使 用 map 作 为 锁 ， 
putIfAbsent 方 法 可 以 改 为 : 


public V putIfAbsent(K key, V value){ 
Synchronized(map ){ 
V old = map.get(key); 
if(old!=null1){ 
return old; 


return map.put(key, value); 


3 从 代 


对 于 同步 容 需 对 象 ， 虽 然 单个 操作 是 安全 的 ， 但 迭代 并 不 是 。 我 
们 看 个 例子 ， 创 建 一 个 同步 List 对 象 ， 一 个 线程 修改 List， 另 一 个 遇 
历 ， 看 看 会 发 生 什么 ， 如 代码 清单 15-11 所 示 。 


代码 清单 15-11 同步 容器 迭代 问题 


private static void startModifyThread(final List<String> list) { 
Thread modifyThread = new Thread(new Runnable() { 
Q@Override 
public void run() { 
for(int i = 0; i < 100; i++) { 
list.add("item " + i); 


try { 
Thread.sleep((int) (Math.random() * 10)); 
} catch (InterruptedException e) { 


} 
}); 
modifyThread.start(); 
} 
private static void startIteratorThread(final List<String> list) { 
Thread iteratorThread = new Thread(new Runnable() { 
@Override 
public void run() { 
while (true) { 
for(String Str : list) { 
} 


} 
}); 


iteratorThread.start(); 


public static void main(String[] args) { 
final List<String> list = Collections 
.SynchronizedList(new ArrayList<String>()); 
startIiteratorThread(list); 
startModifyThread(1ist); 


运行 该 程序 ， 程 序 抛 出 并 发 修改 异常 


Exception in thread "Thread-0" java.util.ConcurrentModificationException 
at java.util.ArrayList$Itr.checkForComodification(ArrayList.java:859) 
at java.util.ArrayList$Itr.next(ArrayList.java:831) 


我 们 之 前 介绍 过 这 个 异常 ， 如 果 在 忆 历 的 同时 容 兹 发 生 了 结构 性 
变化 ， 束 会 抛 出 该 异常 。 同 步 容 强 并 没有 解决 这 个 问题 ， 如 果 要 避 人 锡 
这 个 异常 ， 需 要 在 遍历 的 时 候 给 整个 容器 对 象 加 锁 。 比如 ， 上 面 的 代 
人 码 startIteratorThread 可 以 改 为 : 


private static void startIteratorThread(final List<String> list) { 
Thread iteratorThread = new Thread(new Runnable() { 
Q@Override 
public void run() { 
while(true) { 
synchronized(l1ist){ 
for(String str : list) { 


}); 


iteratorThread.start(); 


4. 并 发 容器 


除了 以 上 这 些 注意 事项 ， 同 步 容器 的 性 能 也 是 比较 低 的 ， 当 并 发 
访问 量 比较 大 的 时 候 性 能 比较 过 。 所 圣 的 是 ，Java 中 还 有 很 多 专 为 并 发 
设计 的 容器 类 ， 比 如 : 


‘CopyOnWriteArrayList ° 
‘ConcurrentHash Map ° 
“ConcurrentLinkedQueue ° 


‘ConcurrentSkipListSet ° 


_ 这些 容 帮 类 都 是 线程 安全 的 ， 但 都 没有 使 用 synchronized， 没 有 大 
代 问 题 ， 直 接 文 持 一 些 复 合 操作 ， 性 能 也 局 得 多 ， 它 们 能 解决 什么 问 
题 ? 怎么 使 用 ? 实现 原理 是 什么 ? 我 们 后 续 章 节 介 绍 。 


人 至此， 关于 synchronized 殉 介绍 完了 。 本 蔬 详 细 介 绍 了 synchronized 
的 用 法 和 实现 原理 ， 为 进一步 理解 synchronized， 介 绍 了 可 重 入 性 、 内 
存 可 见 性 、 死 锁 等 ， 最 后 ， 介 绍 了 同步 容器 及 其 注意 事项 ， 如 复合 操 
作 、 伪 同步 、 返 代 异 党 、 并 发 容器 等 。 


15.3 ”线程 的 基本 协作 机 制 


多 线程 之 间 除 了 苋 争 访问 同一 个 资源 外 ， 也 经 党 需要 相互 协作 ， 
怎么 协作 呢 ? 本 太 就 来 介绍 Java 中 多 线程 协作 的 基本 机 制 wait/notify。 


都 有 哪些 场景 需要 协作 ? wait/notify 是 什么 ?如 何 使 用 ? 实现 原理 
征 什 么 ? 协作 的 核心 是 什么 ? 如 何 实现 各 种 典型 的 协作 场景 ? 本 市 进 
行 详细 讨 论 ， 我 们 先 来 看 看 都 有 哪些 协作 的 场景 。 


15.3.1 协作 的 场景 


多 线程 之 间 需 要 协作 的 场景 有 很 多 ， 比 如 : 


1) 生产 者 /消费 者 协作 模式 ， 这 是 一 种 常见 的 协作 模式 ， 生 产 者 
线程 和 消费 者 线程 通过 共 译 队列 进行 协作 ， 生 产 者 将 数据 或 任务 放 到 
队列 上 ， 而 消费 者 从 队列 上 取 数 据 或 任务 ， 如 果 队 列 长 度 有 限 ， 在 队 
列 满 的 时 候 ， 生 产 者 需要 等 待 ， 而 在 队列 为 空 的 时 候 ， 消 费 者 需要 等 


待 。 
2) 同时 开始 ， 关 似 运动 员 比 赛 ， 在 听 到 比赛 开始 枪 响 后 同时 开 
始 ， 在 一 些 程序 ， 尤 其 是 模拟 仿真 程序 中 ， 要 求 多 个 线程 能 同时 开 


始 


3) 等 竺 结束: 主 从 协作 模式 也 是 一 种 常见 的 协作 模式 ， 主 线程 将 
任务 分 解 为 看 干 子 任务 ， 为 每 个 子 任 务 创建 一 个 线程 ， 主 线程 在 继续 
执行 其 他 任务 之 前 需要 等 竺 每 个 子 任务 执行 完毕 。 


4) 异步 结果 ， 在 主 从 协作 模式 中 ， 主 线程 手工 创建 子 线程 的 写法 
往往 比较 麻烦 ， 一 种 常见 的 模式 是 将 子 线程 的 管理 封装 为 异步 调用 ， 
异步 调用 马上 返回 ， 但 返回 的 不 是 最 终 的 结果 ， 而 是 一 个 一 般 称 为 
Future 的 对 象 ， 通 过 它 可 以 在 随后 获得 最 终 的 结果 。 


5) 集合 点 : 类 似 于 学 校 或 公司 组 团 旅 游 ， 在 旅游 过 程 中 有 若干 集 
合 抬 ， 比 如 出 发 集合 点 ， 每 个 人 从 不 同 地 方 来 到 集合 点 ， 所 有 人 到 齐 
后 进行 下 一 项 活动 ， 在 一 些 程 序 ， 比 如 并 行 迭 代 计 算 中 ， 每 个 线程 负 


责 一 部 分 计算 ， 然 后 在 集合 点 等 待 其 他 线程 完成 ， 所 有 线程 到 齐 后 ， 
交换 数据 和 计算 结果 ， 再 进行 下 一 次 迁 代 。 


我 们 会 探讨 如 何 实现 这 些 协作 场景 ， 在 此 之 前 ， 我 们 先 来 了 解 协 
作 的 基本 方法 wait/notify。 


15.3.2 waitnotify 


我 们 知道 ，Java 的 根 父 类 是 Object，Java 在 Object 类 而 非 Thread 类 
中 定义 了 一 些 线程 协作 的 基本 方法 ， 使 得 每 个 对 象 都 可 以 调用 这 些 方 
法 ， 这 些 方法 有 了 两 类 ， 一 类 是 wait， 男 一 类 是 notify。 


主要 有 了 两 个 wait 方 法 : 


public final void wait() throws InterruptedException 
public final native void wait(long timeout) throws InterruptedException; 


一 个 珊 时 间 参 数 ， 单 位 是 毫秒 ， 表 示 最 多 等 竺 这么 长 时 间 ， 人 参数 
为 0 表示 无 限期 等 待 ; 一 个 不 带 时 间 参 数 ， 表 示 无 限期 等 待 ， 实 际 丈 是 
调用 wait (0) 。 在 等 竺 期间 都 可 以 被 中 断 ， 如 果 被 中 断 ， 会 抛 出 
InterruptedException。 关 于 中 靳 及 中 断 处 理 ， 我 们 在 下 节 介 绍 ， 本 市 和 暂 
时 忽略 该 异常 。 


wait 实 际 上 做 了 什么 呢 ? 它 在 等 待 什么 ?上 廊 我 们 说 过 ， 每 个 对 
象 都 有 一 把 锁 和 等 待 队列， 一 个 线程 在 进入 synchronized 代 码 块 时 ， 会 
冬 试 获取 锁 ， 如 果 获 取 不 到 则 会 把 当前 线程 加 入 等 待 队 列 中 ， 其 实 ， 
除了 用 于 锁 的 等 竺 队列 ， 每 个 对 象 还 有 另 一 个 等 竺 队列， 表示 条 件 队 
列 ， 该 队列 用 于 线程 间 的 协作 。 调 用 wait 束 会 把 当前 线程 放 到 条 件 队 
列 上 并 阻塞 ， 表 示 当 前 线程 执行 不 下 去 了 ， 它 需要 等 待 一 个 条 件 ， 这 
个 条 件 它 目 己 改变 不 了 ， 需 要 其 他 线程 改变 。 当 其 他 线程 改变 了 条 件 
后 ， 应 该 调用 Object 的 notify 方 法 : 


public final native void notify(); 
public final native void notifyAll(); 


notify 做 的 事情 就 是 从 条 件 队 列 中 选 一 个 线程 ， 将 其 从 队列 中 移 除 
， 人 区 别 是 ， 它 会 移 除 条 件 队 列 中 所 有 的 线程 
并 全 部 唤醒 。 


我 们 来 看 个 简单 的 例子 ， 一 个 线程 局 动 后 ， 在 执行 一 项 操作 前 ， 
它 需 要 等 竺 主线 程 给 它 指令 ， 收 到 指令 后 才 执 行 ， 如 代码 请 单 15-12 所 
坟 5 


代码 清单 15-12 ”简单 协作 示例 WaitThread 


public class WaitThread extends Thread { 

private volatile boolean fire = false,; 
QOverride 
public void run() { 

try { 

synchronized (this) { 
while( !fire) { 
wait(); 


System,.out.println("fired"); 
} catch(InterruptedException e) { 


public synchronized void fire() { 
this.fire = true; 
notify(); 


public static void main(String[] args) throws InterruptedException { 
WaitThread waitThread = new WaitThread(); 
waitThread.start(); 
Thread.sleep(1000); 
System.out.printjn("fire"); 
waitThread.fire( ); 


示例 代码 中 有 两 个 线程 ， 一 个 是 主线 程 ， 一 个 是 WaitThread， 协 
作 的 条 件 变量 是 fre，WaitThread 等 待 该 变量 变 为 tue， 在 不 为 true 的 时 
候 调 用 wait， 主 线程 设置 该 变量 并 调用 notify。 


两 个 线程 都 要 访问 协作 的 变量 fire， 容 易 出 现 竞 态 条 件 ， 所 以 相关 
代码 都 需要 被 synchronized 保 护 。 实 际 上 ，wait/notify 方 法 只 能 在 
synchronized 代 码 块 内 被 调用 ， 如果 调用 wait/notify 方 法 时 ， 当 前 线程 
没有 持 有 对 象 锁 ， 会 抛 出 异常 java.lang.IlegalMonitor-StateException 。 


你 可 能 会 有 疑问 ， 如 果 wait 必 须 被 synchronized 保 护 ， 那 一 个 线程 
在 wait 时 ， 另 一 个 线程 怎么 可 能 调用 同样 被 synchronized 保 护 的 notify 方 
法 呢 ? 写 不 需要 等 待 锁 吗 ? 我 们 需要 进一步 理解 wait 的 内 部 过 程 ， 虽 
然 是 在 synchronized 方 法 内 ， 但 调用 wait 时 ， 线 程 会 释放 对 象 锁 。 wait 
的 具体 过 程 是 : 


1) 把 当前 线程 放 入 条 件 等 待 队 列 ， 释 放 对 象 锁 ， 阻塞 等 待 ， 线 程 
状态 变 为 WAITING 或 TIMED_WAITING 。 


2) 等 待 时 间 到 或 被 其 他 线程 调用 notify/notifyAll 从 条 件 队 列 中 移 
除 ， 这 时 ， 要 重新 苑 争 对 和 象 锁 : 


-如果 能 够 获得 锁 ， 线 程 状态 变 为 RUNNABLE， 并 从 wait 调 用 中 返 
否则， 该 线程 加 入 对 象 锁 等 待 队 列 ， 线 程 状态 变 为 BLOCKED， 
只 有 在 获得 锁 后 才 会 从 wait 调 用 中 返回 。 


线程 从 wait 调 用 中 返回 后 ， 不 代表 其 等 待 的 条 件 束 一 定 成 立 了 ， 
它 需 要 重新 检查 其 等 竺 的 条 件 ， 一 般 的 调用 模式 是 : 


Synchronized (obj) { 
while( 条 件 不 成 立 ) 
obj .wait(); 


…// 执 行 条 件 满足 后 的 操作 


比如 ， 上 例 中 的 代码 是 : 


synchronized (this) { 
while(!fire) { 
wait(); 


调用 notify 会 把 在 条 件 队列 中 等 每 的 线程 唤醒 并 从 队列 中 移 除 ， 但 
它 不 会 释放 对 象 锁 ， 也 就 是 说 ， 只 有 在 包含 notify 的 synchronized 代 码 
块 执行 完 后 ， 等 待 的 线程 才 会 从 wait 调 用 中 返回 。 


简单 总 结 一 下 ，waitnotify 方 法 看 上 去 很 价 单 ， 但 往往 难以 理解 
wait 等 的 到 底 是 什么 ， 而 notify 通 知 的 又 是 什么 ， 我 们 需要 知道 ， 它 们 
被 不 同 的 线程 调用 ， 但 共享 相同 的 锁 和 条 件 等 每 队列 (相同 对 象 的 
synchronized 代 码 块 内 ) ， 它 们 围绕 一 个 共享 的 条 件 变量 进行 协作 ， 
这 个 条 件 变 量 是 程序 自己 维护 的 ， 当 条 件 不 成 立时 ， 线 程 调用 wait 进 
入 条 件 等 每 队列 ， 男 一 个 线程 修改 了 条 件 变 量 后 调用 notify， 调 用 wait 
的 线程 唤醒 后 需要 重新 检查 条 件 变量 。 从 多 线程 的 角度 看 ， 它 们 围绕 
共享 变量 进行 协作 ， 从 调用 wait 的 线程 角度 看 ， 它 阻塞 等 待 一 个 条 件 
的 成 立 。 我 们 在 设计 多 线程 协作 时 ， 需 要 想 清楚 协作 的 共享 变量 和 条 
件 是 什么 ， 这 是 协作 的 核心 。 接 下 来 ， 我 们 通过 一 些 场景 进一步 理解 
waitnotify 的 应 用 。 


15.3.3 ”生产 者 /消费 者 模式 


在 生产 者 /消费 者 模式 中 ， 协 作 的 共 圣 变量 是 队列 ， 生 产 者 往 队 列 
上 放 数 据 ， 如 果 满 了 束 wait， 而 消费 者 从 队列 上 取 数 据 ， 如 果 队 列 为 
至 也 wait。 我 们 将 队列 作为 单独 的 类 进行 设计 ， 如 代码 清单 15-13 所 
坟 5 


代码 清单 15-13 ”生产 者 /消费 者 协作 队列 


static class MyBlockingQueue<E> { 
private Queue<E> queue = null; 
private int limit; 
public MyBlockingQueue(int limit) { 
this,1Limit = limit,; 
dueue = new ArrayDeque<>(1imit); 


public synchronized void put(E e) throws InterruptedException { 
while(queue.size() == limit) { 
wait(); 


queue.add(e); 
notifyAll(); 


public synchronized E take() throws InterruptedException { 
while(queue.isEmpty()) { 
wait(); 


E e = queue.poll()， 
notifyAll(); 
return e; 


MyBlockingQueue 是 一 个 长 度 有 限 的 队列 ， 长 度 通过 构造 方法 的 
参数 进行 传递 ， 有 两 个 方法 : put 和 take。put 是 给 生产 者 使 用 的 ， 往 队 
列 上 放 数 据 ， 满 了 就 wait， 放 完 之 后 调用 notifyAll， 通 知 可 能 的 消费 
者 。take 是 给 消费 者 使 用 的 ， 从 队列 中 取 数 据 ， 如 果 为 空 束 wait， 取 完 
之 后 调用 notifyAll， 通 知 可 能 的 生产 者 。 


我 们 看 到 ，put 和 take 都 调用 了 wait， 但 它们 的 目的 是 不 同 的 ， 或 
者 说 ， 它 们 等 竺 的 条 件 是 不 一 样 的 ，put 等 待 的 是 队列 不 为 满 ， 而 take 
等 待 的 是 队列 不 为 空 ， 但 它们 都 会 加 入 相同 的 条 件 等 竺 队列 。 由 于 条 
件 不 同 但 又 使 用 相同 的 等 待 队 列 ， 所 以 要 调用 notifyAl 而 不 能 调用 
notify， 因 为 notify 只 能 唤醒 一 个 线程 ， 如 采 唤 醒 的 是 同类 线程 吏 起 不 
到 协调 的 作用 。 


只 能 有 一 个 条 件 等 每 队列 ， 这 是 Java wait/notify 机 制 的 局 限 性 ， 这 
使 得 对 于 等 竺 条件 的 分 析 变 得 复 洒 ， 后 续 章 世 我 们 会 介绍 显 式 的 锁 和 
条 件 ， 它 可 以 解决 该 问题 。 

一 个 简单 的 生产 者 代码 如 代码 清单 15-14 所 示 。 


代码 清单 15-14 ”一 个 简单 的 生产 者 


static class Producer extends Thread { 
MyBlockingQueue<String> queue; 
public Producer (MyBlockingQueue<String> queue) { 
this.queue = queue,; 


QOverride 
public void run() { 
int num = 0; 
try { 
while(true) { 
String task = String.valueof(num); 
queue.put(task); 
System.out.println("produce task ”+ task); 
NUum++; 
Thread.sleep((int) (Math.random() * 100)); 


} 
} catch (InterruptedException e) { 
} 


Producer 问 共享 队列 中 插入 模拟 的 任务 数据 。 一 个 稍 单 的 消费 者 
代码 如 代码 清单 15-15 所 示 。 


代码 请 单 15-15 一 个 傈 单 的 消费 者 


static class Consumer extends Thread { 
MyBlockingQueue<String> queue; 
public Consumer (MyBlockingQueue<String> queue) { 


this.queue = queue,; 
QOverride 
public void run() { 
try { 
while(true) { 
String task = queue.take(); 
System.out.println("handle task " + task); 
Thread.sleep((int)(Math.random()*100)); 


} 
} catch(InterruptedException e) { 


} 
} 
} 


主 程序 的 示例 代码 如 下 所 示 : 


public static void main(String[] args) { 
MyBlockingQueue<String> queue = new MyBlockingQueue<>(10); 


new Producer(queue).start(); 
new Consumer(queue).start(); 


} 


运行 该 程序 ， 会 看 到 生产 者 和 消费 者 线程 的 输出 交 共 出现。 


我 们 实现 的 MyBlockingQueue 主 要 用 于 演示 ，Java 提 供 了 专门 的 阻 
塞 队列 实现 ， 包 括 : 


.接口 BlockingQueue 和 了 BlockingDeque。 

.基于 数组 的 实现 类 ArrayBlockingQueue 。 

:基于 链表 的 实现 类 LinkedBlockingQueue 和 LinkedBlockingDeque 。 
.基于 堆 的 et 。 


我 们 会 在 后 续 革 市 介绍 这 些 类 ， 在 实际 系统 中 ， 应 该 优先 考虑 使 
用 这 些 类 。 


15.3.4 同时 开始 


同时 开始 ， 类 似 于 运动 员 比 赛 ， 在 听 到 比赛 开始 枪 响 后 同时 开 
台 ， 下 面 ， 我 们 模拟 这 个 过 程 。 这 里 ， 有 一 个 主线 程 和 N 个 子 线程 ， 
每 个 子 线程 模拟 一 个 运动 员 ， 主 线程 模拟 裁判 ， 它 们 协作 的 共享 变量 
是 一 个 开始 信和 号。 我 们 用 一 个 类 FireFlag 来 表示 这 个 协作 对 象 ， 如 代码 
清单 15-16 所 示 。 


代码 清单 15-16 ”协作 对 象 FireFlag 


static class FireFlag { 
private volatile boolean fired = false; 
public synchronized void waitForFire() throws InterruptedException { 
while(!fired) { 
wait(); 


public synchronized void fire() { 
this,.fired = true; 
notifyAll(); 
} 
} 


子 线 程 应 该 调用 waitForFire () 等 竺 枪 啊 ， 而 主线 程 应 该 调用 fire 
() 发 射 比 赛 开始 信号 。 


表示 比赛 运动 员 的 类 如 代码 清单 15-17 所 示 。 
代码 清单 15-17 表示 比赛 运动 员 的 类 


static class Racer extends Thread { 
FireFlag fireFlag; 
public Racer(FireFlag fireFlag) { 
this.fireFlag = fireFlag; 


Q@Override 
public void run() { 
try { 
this.fireFlag.waitForFire(); 
System.out.println("start run " 
+ Thread.currentThread( ).getName( )); 
} catch (InterruptedException e) { 
} 
} 
} 


主 程序 代码 如 下 所 示 : 


public static void main(String[] args) throws InterruptedException { 
int num = 10; 
FireFlag fireFlag = new FireFlag(); 
Thread[] racers = new Thread[num]; 
for(int i = 0; i < num; i++) { 
racers[i] = new Racer(fireFlag); 
racers[il].start(); 


} 
Thread.sleep(1000); 
fireFlag.fire(); 


这 里 ， 局 动 了 10 个 子 线程 ， 每 个 子 线程 局 动 后 等 得 fire 信 号， 主线 
程 调用 fire () 后 各 个 子 线程 才 开 始 执行 后 续 操作 。 


15.3.5 ”等待 结束 


在 15.1.2 节 中 我 们 使 用 join 方法 让 主线 程 等 待 子 线程 结束 ，join 实 
际 上 就 是 调用 了 wait， 其 主要 代码 是 : 


while (isAlive()) { 
wait(0); 


只 要 线程 是 活着 的 ，isAlive () 返回 true，join 就 一 直 等 待 。 谁 来 
通知 它 呢 ? 当 线 程 运 行 结束 的 时 候 ，Java 系 统 调用 notifyAll 来 通知 。 


使 用 join 有 时 比较 麻烦 ， 需 要 主线 程 逐一 等 待 每 个 子 线程 。 这 
里 ， 我 们 演示 一 种 新 的 写法 。 主 线程 与 各 个 子 线程 协作 的 共享 变量 是 
一 个 数 ， 这 个 数 表示 未 完成 的 线程 个 数 ， 初 始 值 为 子 线程 个 数 ， 主 线 
程 等 待 该 值 变 为 0， 而 每 个 子 线程 结束 后 都 将 该 值 减 一 ， 当 减 为 0 时 调 
0 我 们 用 MyLatch 来 表示 这 个 协作 对 象 ， 如 代码 清单 15-18 
全 O 


代码 清单 15-18 协作 对 象 MyLatch 


public class MyLatch { 
private int count 


public MyLatch(int count ) { 
this.count = count,; 


public synchronized void await() throws InterruptedException { 
while(count > 0) { 
wait(); 
} 


public synchronized void countDown() { 
count--; 
if(count <= 0) { 
notifyAll(); 


这 里 ，MyLatch 构 造 方法 的 参数 count 应 初始 化 为 子 线程 的 个 数 ， 
主线 程 应 该 调用 await () ， 而 子 线程 在 执行 完 后 应 该 调用 countDown 
() 。 工 作 子 线程 的 示例 代码 如 代码 清单 15-19 所 示 。 


代码 清单 15-19 ”使 用 MyLatch 的 工作 子 线程 


static class Worker extends Thread { 
MyLatch latch; 
public Worker(MyLatch latch) { 
this,.latch = latch,; 


QOverride 
public void run() { 
try { 
//simulate working on task 
Thread.sleep((int) (Math.random() * 1000)); 
this.1latch.countDown( ); 
} catch (InterruptedException e) { 
} 


主线 程 的 示例 代码 如 下 : 


public static void main(String[] args) throws InterruptedException { 
int workerNum = 100; 
MyLatch latch = new MyLatch(workerNum); 
Worker[] workers = new Worker[workerNum]; 
for(int i = 0; i < workerNum; i++) { 
workers[i] = new Worker(latch); 
workers[i].start(); 


latch.await(); 
System.out.println("collect worker results"); 


MyLatch 是 一 个 用 于 同步 协作 的 工具 类 ， 主 要 用 于 演示 基本 原 
理 ， 在 Java 中 有 一 个 专门 的 同步 类 CountDownLatch， 在 实际 开发 中 应 
该 使 用 它 。 关 于 CountDownLatch， 我 们 会 在 后 续 章 节 介 绍 。 


MyLatch 的 功能 是 比较 通用 的 ， 它 也 可 以 应 用 于 上 面 “ 同 时 开 
始 ” 的 场景 ， 初 始 值 设 为 1，Racer 类 调用 await () ， 主 线程 调用 
countDown () 即 可 ， 如 代码 清单 15-20 所 示 。 


代码 清单 15-20 ”使 用 MyLatch 实 现 同时 开始 


public class RacerwithLatchDemo { 
static class Racer extends Thread { 
MyLatch latch; 
public Racer(MyLatch latch) { 
this,.latch = latch,; 


QOverride 
public void run() { 
try { 
this.1latch.await( ); 
System.out.printjn("start run " 
+ Thread.currentThread().getName()); 
} catch (InterruptedException e) { 


} 


public static void main(String[] args) throws InterruptedException { 
int num = 10; 
MyLatch latch = new MyLatch(1); 
Thread[] racers = new Thread[num]; 
for(int i = 0; i < num; i++) { 
racers[i] = new Racer(latch); 
racers[il].start(); 


} 
Thread.sleep(1000 ) ， 
Jatch.countDown( ) ， 


15.3.6 ”异步 结果 


在 主 从 模式 中 ， 手 工 创 建 线 程 往往 比较 麻烦 ， 一 种 常见 的 模式 是 
异步 调用 ， 异 步调 用 返回 一 个 一 般 称 为 Future 的 对 象 ， 通 过 它 可 以 获 
得 最 终 的 结果 。 在 Java 中 ， 表 示 子 任务 的 接口 是 Callable， 声 明 为 : 


public interface Callable<V> { 
V call() throws Exception; 


”为 表示 异步 调用 的 结果 ， 我 们 定义 一 个 接口 MyFuture， 如 下 所 
和 个: 


public interface MyFuture <V> { 
V get() throws Exception ， 


这 个 接口 的 get 方 法 返回 真正 的 结果 ， 如 果 结 果 还 没有 计算 完成 ， 
get 方 法 会 阻塞 直到 计算 完成 ， 如 采 调 用 过 程 发 生 异 常 ， 则 get 方 法 抛 出 
调用 过 程 中 的 异 帅 。 


为 方便 主线 程 调用 子 任务 ， 我 们 定义 一 个 类 MyExecutor， 其 中 定 
ee 表示 执行 子 任务 并 返回 异步 结果 ， 声 明 如 


public <V> MyFuture<V> execute(final Callable<V> task) 


利用 该 方法 ， 对 于 主线 程 ， 就 不 需要 创建 并 管理 子 线 程 了 ， 并 且 
可 以 方便 地 获取 异步 调用 的 结果 。 比如 ， 在 主线 程 中 ， 可 以 类 似 代码 
清单 15-21 那 样 启动 异 步调 用 并 获取 结果 : 


代码 清单 15-21 异步 调用 示例 


public static void main(String[] args) { 
MyExecutor executor = new MyExecutor(); 
// 子 任务 
callable<Integer> subTask = new Callable<Integer>() { 
QOverride 
public Integer call() throws Exception f{ 
//.… 执 行 异步 任务 
int millis = (int) (Math.random() * 1000); 
Thread.sleep(millis); 
return millis; 


} 


}; 

// 异 步调 用 ， 返 回 一 个 MyFuture 对 象 

MyFuture<Integer> future = executor.execute(subTask); 
//.… 执 行 其 他 操作 
try { 


// 获 取 异 步调 用 的 结 
Integer result = future.get(); 
System.out.printjn(result); 

} catch(Exception e) { 
e.printStackTrace( ); 


MYyExecutor 的 execute 方 法 是 怎么 实现 的 呢 ? 它 封装 了 创建 子 线 
程 ， 同 步 获取 结 果 的 过 程 ， 它 会 创建 一 个 执行 子 线程 ， 该 子 线程 如 代 
码 清单 15-22 所 示 。 


代码 清单 15-22 ”执行 子 线程 ExecuteThread 


static class ExecuteThread<V> extends Thread { 

private V result = null; 

private Exception exception = null,; 

private boolean done = false; 

private Callable<V> task; 

private Object lock; 

public ExecuteThread(Callable<V> task, Object lock) { 
this.task = task; 
this.lock = lock; 


QOverride 
public void run() { 
try { 
result = task.call(); 
} catch (Exception e) { 
exception = e; 
} finally { 
Synchronized (lock) { 
done = true; 
lock.notifyAll( ); 


} 


} 
public V getResult() { 
return result; 


public boolean isDone() { 
return done; 


} 
public Exception getException() { 
return exception; 


这 个 子 线程 执行 实际 的 子 任务 ， 记 录 执 行 结果 到 result 变 量 、 异 党 
到 exception 变 量 ， 执 行 结束 后 设置 共享 状态 变量 done 为 trtue， 并 调用 
notifyAll， 以 唤醒 可 能 在 等 竺 结果 的 主线 程 。 


MyExecutor 的 execute 方 法 如 代码 清单 15-23 所 示 。 


代码 清单 15-23 ”异步 执行 任务 


public <V> MyFuture<V> execute(final Callable<V> task) { 

final Object lock = new Object(); 
final ExecuteThread<V> thread = new ExecuteThread<>(task, lock); 
thread. start(); 
MyFuture<V> future = new MyFuture<V>() { 

Q@Override 

public V get() throws Exception { 

synchronized (lock) { 
while('!'thread.isDone()) { 


try { 
lock.wait( ); 
} catch (InterruptedException e) { 


} 
if(thread.getException() != nul1) { 
throw thread.getException(); 


} 
return thread.getResult(); 


} 
} 


/7 
return future 


execute 启 动 一 个 线程 ， 并 返回 MyFuture 对 象 ，MyFuture 的 get 方 法 
会 阻塞 等 竺 直到 线程 运行 结束 。 

以 上 的 MyExecutore 和 MyFuture 主 要 用 于 演示 基本 原理 ， 实 际 上 ， 
Java 中 已 经 包含 了 一 套 完善 的 框架 Executors， 相 关 的 部 分 接口 和 类 
有 : 


.表示 异步 结果 的 接口 Future 和 实现 类 FutureTask 。 


:用 于 执行 异步 任务 的 接口 Executor， 以 及 有 更 多 功能 的 子 接口 


ExecutorService ° 


.用 于 创建 Executor 和 ExecutorService 的 工厂 方法 类 Executors。 


后 续 章 世 ， 我 们 会 详细 介绍 这 寿 框 如 。 


15.3.7 集合 点 


各 个 线程 先生 分头 行动 ， 各 目 到 达 一 个 集合 点 ， 在 集合 点 需要 集 
齐 所 有 线程 ， 交 换 数 据 ， 然 后 再 进行 下 一 步 动 作 。 怎 么 表示 这 种 协作 
呢 ? 协作 的 共 至 变量 依然 是 一 个 数 ， 这 个 数 表 示 示 到 集合 点 的 线程 个 
数 ， 初 始 值 为 子 线程 个 数 ， 每 个 线程 到 达 集 合 点 后 将 该 值 减 一 ， 如 采 
不 为 0， 表 示 还 有 别 的 线程 未 到 ， 进 行 等 每 ， 如 琳 变 为 0， 表 示 目 己 是 
最 后 一 个 到 的 ， 调 用 notifyAll 唤 醒 所 有 线程 。 我 们 用 AssemblePoint 类 
来 表示 这 个 协作 对 象 ， 如 代码 请 单 15-24 所 示 。 


代码 清单 15-24 ”协作 对 象 AssemblePoint 


public class AssemblePoint { 
private int n,; 
public AssemblePoint(int n) { 
this.n = n; 


public synchronized void await() throws InterruptedException 1{ 
if(n > 0) { 


Nn--, 
if(n == 0) 


{ 
notifyAll(); 
} else { 
while(n != 0) { 
wait(); 
} 


多 个 游客 线程 各 目 先 独立 运行 ， 然 后 使 用 该 协作 对 和 象 到 达 集 合 点 
进行 同步 的 示例 如 代码 清单 15-25 所 示 。 


代码 清单 15-25 ”集合 点 协作 示例 


public class AssemblePointDemo { 
static class Tourist extends Thread { 
AssemblePoint ap; 
public Tourist(AssemblePoint ap) { 
this.ap = ap; 


Q@Override 
public void run() { 
try { 
// 模 拟 先 各 自 独 立 运行 
Thread.sleep((int) (Math.random() * 1000)); 
// 集 合 
ap.await(); 
System.out.println("arrived"); 
//.… 集 合 后 执行 其 他 操作 


} catch (InterruptedException e) { 


} 


public static void main(String[] args) { 
int num = 10; 
Tourist[] threads = new Tourist[num]; 
AssemblePoint ap = new AssemblePoint(num); 
for(int i = 0; i < num; i++) { 
threads[i] = new Tourist(ap); 
threads[i].start(); 


这 里 实现 的 AssemblePoint 主 要 用 于 演示 基本 原理 ，Java 中 有 一 个 
专门 的 同步 工具 类 CyclicBarrier 可 以 替代 它 ， 关 于 该 类 ， 我 们 后 续 草 万 


介绍 。 
15.3.8 小结 


本 六 介绍 了 Java 中 线程 间 协 作 的 基本 机 制 waitnotify， 协 作 关 键 要 

想 清 楚 协 作 的 共享 变量 和 条 件 是 什么 ， 为 进一步 理解 ， 针 对 多 种 协作 

场景 ， 我 们 演示 了 wait/notify 的 用 法 及 基本 协作 原理 。Java 中 有 专门 为 

协作 而 建 的 阻塞 队列 、 同 步 工 具 类 ， 以 及 Executors 框 架 ， 我 们 会 在 后 

ls ° 在 实际 开发 中 ， 应 该 尽量 使 用 这 些 现成 的 类 ， 而 非 “ 重 新 
书 2? [© 


15.4 线程 时 中 灯 


本 看 主 要 讨论 一 个 问题 ， 如 何在 Java 中 取消 或 关闭 一 个 线程 ? 我 
们 先 介 绍 都 有 哪些 场景 需要 取消 /关闭 线程 ， 再 介绍 取消 /关闭 的 机 
制 ， 以 及 线程 对 中 断 的 反应 ， 最 后 讨论 如 何 正确 地 取消 /关闭 线程 。 


15.4.1 ”取消 /关闭 的 场景 


我 们 知道 ， 通 过 线程 的 start 方 法 启动 一 个 线程 后 ， 线 程 开始 执行 
run 方 法 ，run 方 法 运行 结束 后 线程 退出 ， 那 为 什么 还 需要 结束 一 个 线 
程 呢 ? 有 多 种 情况 ， 比 如 : 


1) 很 多 线程 的 运行 模式 是 死 循环 ， 比 如 在 生产 者 /消费 者 模式 
中 ， 消 费 者 主体 吏 是 一 个 死 循 环 ， 它 不 停 地 从 队列 中 接受 任务 ， 执 行 
任务 ， 在 俘 止 程序 时 ， 我 们 需要 一 种 “优雅 ?的 方法 以 关闭 该 线程 。 


2) 在 一 些 图 形 用 户 界 面 程序 中 ， 线 程 是 用 户 启 动 的 ， 完 成 一 些 任 
务 ， 比 如 从 远程 服务 器 上 下 载 一 个 文件 ， 在 下 载 过 程 中 ， 用 户 可 能 会 
希望 取消 该 任务 。 


3) 在 一 些 场景 中 ， 比 如 从 第 三 方 服务 句 查 询 一 个 结果 ， 我 们 希望 
在 限定 的 时 间 内 得 到 结果 ， 如 果 得 不 到 ， 我 们 会 布 望 取消 该 任务 。 

4) 有 时， 我 们 会 启动 多 个 线程 做 同一 件 事 ， 比 如 类 似 抢 火 车 票 ， 
我 们 可 能 会 让 多 个 好 友 帮 忙 从 多 个 渠道 买 火车 票 ， 只 要 有 一 个 渠道 买 
到 了 ， 我 们 会 通知 取消 其 他 渠道 。 


15.4.2 ”取消 /关闭 的 机 制 


Java 的 Thread 类 定义 了 如 下 方法 : 


public final void stop() 


这 个 方法 看 上 去 束 可 以 俘 目 线程， 但 这 个 方法 和 被 标记 为 了 过 时 ， 
人 简单 地 说 ， 我 们 不 应 该 使 用 它 ， 可 以 忽略 它 。 


在 Java 中 ， 停 止 一 个 线程 的 主要 机 制定 中 断 ， 中 断 并 不 是 强迫 终 
止 一 个 线程 ， 它 是 一 种 协作 机 制 ， 是 给 线程 传递 一 个 取消 信号 ， 但 是 
人 ”本 万 我 们 主要 束 是 来 理解 Java 的 中 
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Thread 类 定义 了 如 下 关于 中 晰 的 方法 : 


public boolean isInterrupted() 
public void interrupt( 
public static boolean interrupted() 


这 三 个 方法 名 字 类 似 ， 比 较 容 易 混淆 ， 我 们 解释 一 下 。 
isInterrupted () 和 interrupt () 是 实例 方法 ， 调 用 它们 需要 通过 线程 
对 象 ，interrupted () 是 静态 方法 ， 实 际会 调用 Thread.currentThread 

() 操作 当前 线程 。 


每 个 线程 都 有 一 个 标志 位 ， 表 示 该 线程 是 否 被 中 断 了 。 

1) isInterrupted: 返回 对 应 线程 的 中 断 标 志 位 是 否 为 true。 

2) interrupted: 返回 当前 线程 的 中 断 标志 位 是 否 为 tue， 但 它 还 有 
一 个 重要 的 副作用 ， 束 是 清空 中 断 标 志 人 位， 也 就 是 说 ， 连 续 两 次 调用 
interrupted () ， 第 一 次 返回 的 结果 为 tue， 第 二 次 一 般 就 是 false ( 除 
非 同时 又 发 生 了 一 次 中 断 ) 。 


3) interrupt: 表示 中 断 对 应 的 线程 。 中 断 具 体 意味 着 什么 昵 ? 下 
面 我 们 进一步 来 说 明 。 


15.4.3 ”线程 对 中 断 的 反应 


interrupt () 对 线程 的 影响 与 线程 的 状态 和 在 进行 的 IO 操作 有 关 。 
我 们 主要 考虑 线程 的 状态 ，IO 操 作 的 影响 和 具体 IO 以 及 操作 系统 
天 ， 我 们 整 不 讨论 了 了 。 线 程 状态 有 : 


.RUNNABLE: 线程 在 运行 或 具备 运行 条 件 只 是 在 等 待 操作 系统 
调度 。 


-WAITING/TIMED_WAITING: 线程 在 等 待 某 个 条 件 或 超时 。 

.BLOCKED: 线程 在 等 待 锁 ,试图 进入 同步 块 。 

:NEW/TERMINATED: 线程 还 未 启动 或 已 结束 。 
1.RUNNABLE 


如 果 线 程 在 运行 中 ， 且 没有 执行 IO 操作 ，interrupt () 1 
线程 的 中 断 标志 位 ， 没 有 任何 其 他 作用 。 线 程 应 该 在 运行 过 程 中 合 
的 位 置 检 查 中 断 标志 位 ， 比 如 ， 如 果 主 体 代码 是 一 个 循环 ， a 
环 开始 处 进行 检查 ， 如 下 所 示 : 


public class InterruptRunnableDemo extends Thread { 
Q@Override 
public void run() { 
while( !Thread.currentThread().isInterrupted()) { 
//.. 单 次 循环 代码 


System,out,println("done "); 


} 
// 其 他 代码 


2.WAITING/TIMED WAITING 


线程 调用 join/wait/sleep 方 法 会 进入 WAITING 或 TIMED_WAITING 
状态 ， 在 这 些 状 态 时 ， 对 线程 对 象 调用 interrupt () 会 使 得 该 线程 抛 出 
InterruptedException。 需 要 注意 的 是 ， 抛 出 异常 后 ， 中 断 标志 位 会 被 清 
空 ， 而 不 是 被 设置 。 比 如 ， 执 行 如 下 代码 : 


Thread t = new Thread (){ 
QOverride 
public void run() { 
try { 
Thread.sleep(1000); 
} catch (InterruptedException e) { 
System.out.println(isInterrupted( )); 


}; 


t.start(); 


try { 
Thread.sleep(100); 
} catch (InterruptedException e) { 


t.interrupt(); 


程序 的 输出 为 false 。 

InterruptedException 是 一 个 受 检 异 常 ， 线 程 必 须 进 行 处 理 。 我 们 在 
异 肖 处 理 中 介绍 过 ， 处 理 异常 的 基本 思路 是 : 如 琳 知 道 坚 么 处 理 ， 骂 
进行 处 理 ， 如 果 不 知 道 ， 束 应 该 同上 传递 ， 通 常情 况 下 不 应 该 捕获 异 
常 然后 忽略 。 

捕获 到 InterruptedException， 通 党 表示 硕 望 结束 该 线程 ， 线 程 大 臻 
有 两 种 处 理 方 式 : 

1) 向 上 传递 该 异常 ， 这 使 得 该 方法 也 变 成 了 一 个 可 中 断 的 方法 ， 
需要 调用 者 进行 处 理 ; 

2) 有 些 情况 ， 不 能 向 上 传递 异 弟 ， 比 如 Thread 的 ran 方 法 ， 它 的 
声明 是 固定 的 ， 不 能 抛 出 任何 受 检 异常 ， 这 时 ， 应 该 捕获 异常 ， 进 行 
合适 的 清理 操作 ， 清 理 后 ， 一 般 应 该 调用 Thread 的 interrupt 方 法 设置 中 
断 标志 位 ， 使 得 其 他 代码 有 办 法 知道 它 发 生 了 中 晰 。 


第 一 种 方式 的 示例 代码 如 下 : 


public void interruptibleMethod() throws InterruptedException{ 
//.… 包 售 wait，join 或 sleep 方法 
Thread.sleep(1000); 

} 


第 二 种 方式 的 示例 代码 如 下 : 


public class InterruptwaitingDemo extends Thread { 
QOverride 
public void run() { 
while( !Thread.currentThread().isInterrupted()) { 
try { 
// 模 拟 任务 代码 
Thread.sleep(2000); 
} catch(InterruptedException e) { 
//.. 清 理 操作 


// 重 设 中 断 标志 位 


Thread ,currentThread() ,Interrupt()， 


} 
System.out.println(isInterrupted()); 
} 
// 其 他 代码 
} 
3.BLOCKED 


如 果 线 程 在 等 待 锁 ， 对 线程 对 象 调 用 interrupt () 只 是 会 设置 线程 
的 中 断 标 志 位 ， 线 程 依 然 会 处 于 BLOCKED 状 态 ， 也 就 是 说 ，interrupt 
W 并 不 能 使 一 个 在 等 待 锁 的 线程 真正 < 中断 ”。 我 们 看 段 代 码 ; 


public class InterruptSynchronizedDemo { 
private static Object lock = new Object() 
private static class A extends Thread { 
QOverride 
public void run() { 
synchronized (lock) { 
while (!Thread,.currentThread().isInterrupted()) { 
} 


System.out.printjn("exit"); 


} 


public static void test() throws InterruptedException { 
synchronized (lock) { 
Aa= new A(); 
a.start(); 
Thread.sleep(1000 ) 
a.interrupt(); 
a.join(); 


} 


public static void main(String[] args) throws InterruptedException { 
test(); 
} 


} 


test 方 法 在 持 有 锁 lock 的 情况 下 启动 线程 a， 而 线程 a 也 去 尝试 获得 
负 lock， 所 以 会 进入 锁 等 竺 队列， 随后 test 调 用 线程 a 的 interrupt 方 法 并 
调用 join 等 竺 线程 线程 a 结 束 ， 线 程 a 会 结束 吗 ? 不 会 ，interrupt 方 法 只 
会 设置 线程 的 中 断 标 志 ， 而 并 不 会 使 它 从 锁 等 竺 队列 中 出 来 。 


在 使 用 synchronized 关 键 字 获 取 锁 的 过 程 中 不 啊 应 中 断 请 求 ， 这 是 
synchronized 的 局 限 性 。 如 条 这 对 程序 是 一 个 问题 ， 应 该 使 用 吕 式 锁 。 
第 16 章 会 介绍 显 式 锁 Lock 接 口 ， 它 支持 以 响应 中 断 的 方式 获取 锁 。 


4.NEW/TERMINATE 
如 果 线 程 尚未 启动 NEW) ， 或 者 已 经 结 


(TERMINATED) ， 则 调用 interrupt () 对 它 没 有 任何 效果 ， 中 断 标 
志 位 也 不 会 被 设置 。 


15.4.4 ”如 何 正 确 地 取消 /关闭 线程 


interrupt 方 法 不 一 定 会 真正 中断” 线程 ， 它 只 是 一 种 协作 机 制 ， 如 
果 不 明 白 线 程 在 做 什么 ， 不 应 该 贸然 地 调用 线程 的 interrupt 方 法 ， 以 
为 这 样 承 能 取消 线程 。 


对 于 以 线程 提供 服务 的 程序 模块 而 言 ， 它 应 该 封 疼 取 请 /关闭 操 
作 ， 提 供 单独 的 取消 /关闭 方法 给 调用 者 ， 外 部 调用 者 应 该 调用 这 些 方 
法 而 不 是 直接 调用 interrupt。 Java 并 发 库 的 一 些 代 码 吏 提 供 了 单独 的 取 
消 /关闭 方法 ， 比 如 ，Future 接 口 提供 了 如 下 方法 以 取消 任务 : 


boolean cancel(boolean mayInterruptIfRunning ) ， 


再 如 ，ExecutorService 提 供 了 如 下 两 个 关闭 方法 : 


void shutdown( ) ; 
List<Runnable> ShutdownNow( ) ， 


Future 和 ExecutorService 的 API 文 档 对 这 旦 方法 都 进行 了 详细 说 
明 ， 这 是 我 们 应 该 学 习 的 方式 。 关 于 这 两 个 接口 ， 我 们 后 续 章 节 介 
和 


15.4.5 ”小 结 


本 节 主 要 介绍 了 在 Java 中 如 何 取消 /关闭 线程 ， 主 要 依赖 的 技术 是 
中 断 ， 但 它 古 一 种 协作 机 制 ， 不 会 强迫 终止 线程 ， 我 们 介绍 了 线程 在 
不 同 状 态 下 对 中 断 的 反应 。 作 为 线程 的 实现 者 ， 应 该 提供 明确 的 取消 / 
关闭 方法 ， 并 用 文档 摘 述 清楚 其 行为 ， 作 为 线程 的 调用 者 ， 应 该 使 用 
其 取消 /关闭 方法 ， 而 不 是 贸然 调用 interrupt 。 


至 此 ， 关 于 线程 的 基础 内 容 束 介绍 完了 。 在 Java 中 还 有 一 套 并 发 
工具 包 ， 位 于 包 java.util.concurrent 下， 里 面包 括 很 多 易 用 旦 高 性 能 的 
并 发 开发 工具 ， 从 下 一 章 开 始 ， 我 们 就 来 讨论 它 ， 先 从 最 基本 的 原子 
变量 和 CAS (Compare And Set) 操作 开始 。 


第 16 章 ”并 发 包 的 基石 


15 章 介绍 了 线程 的 基本 内 容 ， 在 Java 中 还 有 一 套 并 发 工具 包 ， 位 
于 包 java.util.concurrent 下， 里 面包 括 很 多 易 用 旦 高 性 能 的 并 发 开发 工 
具 。 从 本 章 开始 ， 我 们 就 来 探讨 Java 并 发 工具 包 。 


本 革 主 要 介绍 并 发 包 的 一 些 基础 内 容 ， 分 为 3 个 小 节 : 16.1 节 介绍 
最 基本 的 原子 变量 及 其 背后 的 原理 和 思维 ;16.2 节 介绍 可 以 替代 
synchronized 的 显 式 锁 ;，16.3 广 介绍 可 以 蔡 代 wait/notify 的 显 式 条 件 。 


16.1 原子 变量 和 CAS 


什么 是 原子 变量 ? 为 什么 需要 它们 呢 ? 我 们 从 synchronized 说 起 。 
在 15.2 节 ， 我 们 介绍 过 Counter 类 ， 使 用 synchronized 关 键 字 保 证 原子 更 
新 操作 ， 代 码 如 下 : 


public class Counter { 
private int count 
public synchronized void incr(){ 
count ++; 


} 
public synchronized int getCount() { 
return Count 
} 
} 


对 于 count++ 这 种 操作 来 说 ， 使 用 synchronized 成 本 太 高 了 ， 需 要 
先 获取 锁 ， 最 后 需要 释放 锁 ， 获 取 不 到 锁 的 情况 下 需要 等 每 ,还 会 有 
线程 的 上 下 文 切 换 ， 这 些 都 需要 成 本 。 


对 于 这 种 情况 ， 完 全 可 以 使 用 原子 变量 代 蔡 ，Java 并 发 包 中 的 基 
本 原子 变量 类 型 有 以 下 几 种 。 


.AtomicBoolean: 原子 Boolean 类 型 ， 常 用 来 在 程序 中 表示 一 个 标 


志 位 。 


.AtomicInteger: 原子 Integer 类 型 。 
AtomicLong: 原子 Long 类 型 ， 和 常用 来 在 程序 中 生成 唯一 序列 号 。 
“AtomicReference: 原子 引用 类 型 ， 用 来 以 原子 方式 更 新 复杂 类 
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型 
限于 和 篇幅， 我 们 主要 介绍 AtomicInteger。 除 了 这 4 个 类 ， 还 有 一 些 
其 他 类 ， 如 针对 数组 类 型 的 类 AtomicLongArray、 
AtomicReferenceArray， 以 及 用 于 以 原子 方式 更 新 对 象 中 的 字段 的 类 ， 
如 AtomicIntegerFieldUpdater、AtomicReferenceFieldUpdater 等 。Java 8 


增加 了 几 个 类 ， 在 高 并 发 统计 汇总 的 场景 中 更 为 适合 ， 包 括 


LongAdder、LongAccumulator、Double-Adder 和 DoubleAccumulator， 
具体 可 参见 API 文 档 ， 我 们 就 不 介绍 了 。 


16.1.1 AtomicInteger 


我 们 先 介 绍 AtomicInteger 的 基本 用 法 ， 然 后 介绍 它 的 基本 原理 和 
逻辑 ， 以 及 应 用 。 


1. 基 本 用 法 
AtomicInteger 有 两 个 构造 方法 : 


public AtomicInteger(int initialValue) 
public AtomicInteger() 


第 一 个 构造 方法 给 定 了 一 个 初始 值 ， 第 二 个 构造 方法 的 初始 值 为 
0 。 


可 以 直接 获取 或 设置 AtomicInteger 中 的 值 ， 方 法 是 : 


public final int get() 
public final void set(int newValue) 


之 所 以 称 为 原子 变量 ， 是 因为 它 包 含 一 些 以 原子 方式 实现 组 合 操 
作 的 方法 ， 部 分 方法 如 下 : 


设置 新 值 

getAndSet(int newValue) 
给 当前 值 加 1 

rement() 

给 当前 值 减 1 


// 以 原子 方式 获 
public final i 
// 以 原子 方式 获 
public final i 
// 以 原子 方式 获 
public final i getAndDecrement() 

// 以 原子 方式 获 给 当前 值 加 delta 
public final int getAndAdd(int delta) 
// 以 原子 方式 给 当前 值 加 1 并 获取 新 值 

public final int incrementAndGet() 
// 以 原子 方式 给 当前 值 减 1 并 获取 新 值 

public final int decrementAndGet() 
// 以 原子 方式 给 当前 值 加 delta 并 获取 新 值 
public final int addAndGet(int delta) 
这 些 方法 的 实现 都 依赖 男 一 个 public 方 法 : 
public final boolean compareAndSet(int expect, int update) 
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这 些 方法 的 实现 都 依赖 另 一 个 public 方 法 : 


public final boolean compareAndSet(int expect, int update) 


compareAndSet 是 一 个 非常 重要 的 方法 ， 比 较 并 设置 ， 我 们 以 后 将 
简称 为 CAS。 该 方法 有 两 个 参数 expect 和 update， 以 原子 方式 实现 了 如 
下 功能 : 如 果 当 前 值 等 于 expect， 则 更 新 为 update， 人 否则 不 更 新 ， 如 果 
更 新 成 功 ， 返 回 true， 否 则 返回 false。 


AtomicInteger 可 以 在 程序 中 用 作 一 个 计数 器 ， 多 个 线程 并 发 更 
新 ， 也 总 能 实现 正确 性 。 我 们 看 个 例子 ， 如 代码 请 单 16-1 所 示 。 


代码 清单 16-1 _ AtomicInteger 的 应 用 示例 


public class AtomicIntegerDemo 区 
private static AtomicInteger counter = new AtomicInteger(0); 
static class Visitor extends Thread { 
Q@Override 
public void run() { 
for(int i = 0; i < 1000; i++) { 
counter.incrementAndGet(); 
} 
} 
public static void main(String[] args) throws InterruptedException { 
int num = 1000,; 
Thread[] threads = new Thread[num]; 
for(int i = 0; i < num; i++) { 
threads[i] = new Visitor(); 
threads[i].start(); 


for(int i = 0; i < num; i++) { 
threads[i].join(); 


} 
System.out.println(counter .get()); 


程序 的 输出 总 是 正确 的 ， 为 1000000。 
2. 基 本 原理 和 思维 


AtomicInteger 的 使 用 方法 是 商 单 直接 的 ， 它 是 怎么 实现 的 呢 ? 它 
的 主要 内 部 成 员 是 : 


private volatile int Value， 


注意 : 它 的 声明 带 有 volatile， 这 是 必 需 的 ， 以 保证 内 存 可 见 性 。 


它 的 大 部 分 更 新 方法 实现 都 类 似 ， 我 们 看 一 个 方法 
incrementAndGet， 其 代码 为 : 


public final int incrementAndGet() { 
for(;;) { 


int current = get(); 

int next = current + 1; 

if(compareAndSet(current, next)) 
return next,; 


代码 主体 是 个 死 循 环 ， 移 获取 当前 值 current， 计 算 期 望 的 值 
next， 然 后 调用 CAS 方 法 进行 更 新 ， 如 琳 更 新 没有 成 功 ， 说 明 value 被 
别 的 线程 改 了 ， 则 再 去 取 最 新 值 并 壬 试 更 新 直到 成 功 为 目 。 


与 synchronized 锁 相 比 ， 这 种 原子 更 新 方式 代表 一 种 不 同 的 思维 方 
式 。synchronized 是 悲观 的 ， 它 假定 更 新 很 可 能 冲突 ， 所 以 先 获取 
锁 ， 得 到 锁 后 才 更 狐 。 原 子 变量 的 更 新 逻辑 是 乐观 的 ， 它 假定 冲突 比 
较 少 ， 但 使 用 CAS 更 新 ， 也 就 是 进行 冲突 检测 ， 如 有 果 确 实 冲 突 了 ， 那 
也 没关系 ， 继 续 芝 试 承 好 了 “。synchronized 代 表 一 种 阻塞 式 算 法 ， 得 
不 到 锁 的 时 候 ， 进 入 锁 等 竺 队列， 等 竺 其 他 线程 唤醒 ， 有 上 下 文 切换 
开销 。 原 子 变量 的 更 新 逻辑 是 非 阻 塞 式 的 ， 更 新 冲突 的 时 候 ， 它 就 重 
试 ， 不 会 阻塞 ， 不 会 有 上 下 文 切换 开销 。 对 于 大 部 分 比较 简单 的 操 
作 ， 无 论 是 在 低 并 发 还 是 高 并 发 情况 下 ， 这 种 乐观 非 阻塞 方式 的 性 能 
都 远 高 于 悲观 阻塞 式 方式 。 


原子 变量 相对 比较 简单 ， 但 对 于 复杂 一 些 的 数据 结构 和 算法 ， 非 
阻塞 方式 往往 难于 实现 和 理解 ， 笠 运 的 是 ，Java 并 发 包 中 已 经 提供 了 
一 些 非 阻 塞 容器 ， 我 们 只 需要 会 使 用 就 可 以 了 ， 比 如 : 


.ConcurrentLinkedQueue 和 ConcurrentLinkedDeque: 非 阻 塞 并 发 队 
列 。 


.ConcurrentSkipListMap 和 ConcurrentSkipListSet: 非 阻 塞 并 发 Map 
和 Set 。 


些 容 需 我 们 在 后 续 草 世人 介绍 。 


但 compareAndSet 是 怎么 实现 的 呢 ? 我 们 看 代码 : 


public final boolean compareAndSet(int expect, int update) { 
return unsafe.compareAndSwapInt(this, valueOoffset, expect, update); 
} 


它 调用 了 unsafe 的 compareAndSwapInt 方 法 ，unsafe 是 什么 呢 ? 它 
的 类 型 为 sun.misc.Unsafe， 定 义 为 : 


private static final Unsafe unsafe = Unsafe.getUnsafe( ); 


它 征 Sun 的 私有 实现 ， 从 名 字 看 ， 表 示 的 也 是 “不 安全 ”， 一 般 应 用 
程序 不 应 该 直接 使 用 。 原 理 上 ， 一 般 的 计算 机 系统 都 在 硬件 层次 上 直 
接 文 持 CAS 指 令 ， 而 Java 的 实现 都 会 利用 这 些 特殊 指令 。 从 程序 的 角 
度 看 ， 可 以 将 compareAndSet 视 为 计算 机 的 基本 操作 ， 直 接 接 纳 束 好 。 


3. 实 现 锁 


基于 CAS， 除 了 可 以 实现 乐观 非 阻塞 算法 之 外 ， 还 可 以 实现 悲观 
阻塞 式 算 法 ， 比如 锁 。 实 际 上 ，Java 并 发 包 中 的 所 有 阻塞 式 工具 、 容 
器 、 算 法 也 都 是 基于 CAS 的 〈 不 过 ， 也 需要 一 些 别 的 文 持 ) 。 怎 么 实 
现 锁 呢 ? 我 们 演示 一 个 简单 的 例子 ， 用 AtomicInteger 实 现 一 个 锁 
MyLock， 如 代码 清单 16-2 所 示 。 


代码 清单 16-2 ”使 用 AtomicInteger 实 现 锁 MyLock 


public class MyLock { 
private AtomicInteger Status = new AtomicInteger(0); 
public void lock() { 
while(!status.compareAndSset(0, 1)) { 
Thread.yield( ); 
} 


} 
public void unlock() { 
status.compareAndSet(1, 0); 


在 MyLock 中 ， 使 用 status 表 示 锁 的 状态 ，0 表 示 未 锁定 ，1 表 示 锁 
定 ，lock () 、unlock () 使 用 CAS 方 法 更 新 ，lock () 只 有 在 更 新 成 
功 后 才 退 出 ， 实 现 了 阻塞 的 效果 ， 不 过 一 般 而 言 ， 这 种 阻塞 方式 过 于 
消耗 CPU， 我 们 后 续 章 节 介 绍 更 为 高 将 的 方式 。 MyLock 只 是 用 于 演示 
基本 概念 ， 实 际 开 发 中 应 该 使 用 Java 并 发 包 中 的 类 ， 如 


ReentrantLock ° 
16.1.2 ” ABA 问题 


使 用 CAS 方 式 更 新 有 一 个 ABA 问 题 。 该 问题 是 指 ， 假 设 当前 值 为 
A， 如 果 另 一 个 线程 先 将 A 修改 成 B， 表 修改 回 成 A， 当 前 线程 的 CAS 
操作 无 法 分 辨 当前 值 发 生 过 变化 。 


ABA 是 不 是 一 个 问题 与 程序 的 逻辑 有 关 ， 一 般 不 是 问题 。 而 如 果 
确实 有 问题 ， 解 决 方法 是 使 用 AtomicStampedReference， 在 修改 值 的 
只 有 值 和 时 间 惟 都 相同 才 进行 修改 ， 其 CAS 方 
法 声明 为 : 


public boolean compareAndSet( 
V expectedReference, V newReference, int expectedStamp, int newStamp) 


比如 : 


Pair pair = new Pair(100, 200); 

int stamp = 1; 

AtomicStampedReference<Palir> pairRef = new 
AtomicStampedReference<Pair>(pair, stamp); 

int newStamp = 2; 

pairRef .compareAndSet(pair, new Pair(200, 200), stamp, newStamp); 


AtomicStampedReference 在 compareAndSet 中 要 同时 修改 两 个 值 : 
一 个 是 引用 ， 另 一 个 是 时 间 戳 。 它 怎么 实现 原子 性 呢 ? 实际 上 ， 内 部 
AtomicStampedReference 会 将 两 个 值 组 合 为 一 个 对 象 ， 修 改 的 是 一 个 
值 ， 我 们 看 代码 : 


public boolean compareAndSet(V expectedReference, V newReference, 
int expectedStamp, int newStamp) { 

Pair<V> current = pair; 
return 

expectedReference == current.reference && 

expectedStamp == current ,stamp && 

((newReference == Current .reference && 

newStamp == current .stamp) || 
casPair(current, Pair.of(newReference, newStamp))); 


这 个 Pair 是 AtomicStampedReference 的 一 个 内 部 类 ， 成 员 包括 引用 
和 时 间 稚 ， 具 体 定 义 为 : 


private static class Pair<T> { 
final T reference; 
final int stamp; 
private Pair(T reference, int stamp) { 
this,.reference = reference,; 
this.stamp = stamp; 


static <T> Pair<T> of(T reference, int stamp) { 
return new Pair<T>(reference, stamp); 
} 


} 


AtomicStampedReference 将 对 引用 值 和 时 间 惟 的 组 合 比较 和 修改 
转换 为 了 对 这 个 内 部 类 Pair 单 个 值 的 比较 和 修改 。 


16.13 小结 


本 节 介 绍 了 原子 变量 的 基本 用 法 以 及 背后 的 原理 CAS， 对 于 并 发 
环境 中 的 计数 、 产 生 序列 号 等 需求 ， 应 该 使 用 原子 变量 而 非 氏 ，CAS 
征 Java 并 发 包 的 基础 ， 基 于 它 可 以 实现 高 效 的 、 乐 观 、 非 阻塞 式 数据 
结构 和 算法 ， 它 也 是 并 发 包 中 锁 、 同 步 工具 和 各 种 容 万 的 基础 。 


16.2 ” 显 式 锁 


15.2 节 介绍 了 利用 synchronized 实 现 锁 ， 我 们 提 到 了 synchronized 的 
一 些 局 限 性 ， 本 节 探 讨 Java 并 发 包 中 的 显 式 锁 ， 它 可 以 解决 
synchronized 有 的 限制 。 


J ava 并 发 包 中 的 显 式 锁 接 口 和 类 位 于 包 java.util.concurrent.locks 
下 ， 主 要 接口 和 类 有 : 


. 锁 接 口 Lock， 主 要 实现 类 是 ReentrantLock; 


. 读 写 锁 接 口 ReadWriteLock， 主 要 实现 类 是 
ReentrantReadWriteLock ° 


本 和 主要 介绍 接口 Lock 和 实现 类 ReentrantLock， 关 于 读 写 锁 ， 我 
们 后 续 章 节 介 绍 。 


16.2.1 接口 Lock 
显 式 锁 接口 Lock 的 定义 为 : 


public interface Lock { 
void lock(); 
void lockIinterruptibly() throws InterruptedException; 
boolean tryLock(); 
boolean tryLock(long time, TimeUnit unit) throws InterruptedException,; 
void unlock( ); 
Condition newCondition(); 


下 面 解释 一 下 。 


1) lock () mnlock () : 就 是 普通 的 获取 锁 和 释放 锁 方 法 ，lock 
() 会 阻塞 直到 成 功 。 


2) lockInterruptibly () : 与 lock () 的 不 同 是 ， 它 可 以 响应 中 
条 ， 如 有 果 被 其 他 线程 中 断 了 ， 则 抛 出 InterruptedException 。 


3) tryLock () : 只 是 尝试 获取 锁 ， 立 即 返回 ， 不 阻塞 ， 如 果 获 
取 成 功 ， 返 回 true， 否则 返回 false。 


4) tryLock (long time, J unit) : 移 尝 试 获取 锁 ， 如 采 能 
成 功 则 立即 返回 tue， 和 否则 阻塞 等 待 ， 但 等 待 的 最 长 时 间 由 指定 的 参 
数 设置 ， 在 等 待 的 同时 响应 中 电 ， 衣 果 发 生 了 中 电 抛 出 
InterruptedException， 如 果 在 等 竺 的 时 间 内 获得 了 锁 ， 返 回 true， 否 则 
运 回 false 。 


5) newCondition: 新 建 一 个 条 件 ， 一 个 Lock 可 以 关联 多 个 条 件 ， 
关于 条 件 ， 我 们 留待 16.3 世 介绍 。 


可 以 看 出 ， 相 比 synchronized， 显 式 锁 文 持 以 非 阻 塞 方式 获取 锁 、 
可 以 响应 中 断 、 可 以 限时 ， 这 使 得 它 灵 活 得 多 。 


16.2.2 ”可 重 入 锁 ReentrantLock 


下 面 ， 先 介绍 ReentrantLock 的 基本 用 法 ， 然 后 重点 介绍 如 何 使 用 
tryLock 扣 人 免 死 锁 。 


1. 基 本 用 法 


Lock 接 口 的 主要 实现 类 是 ReentrantLock， 它 的 基本 用 法 
lock/unlock 实 现 了 与 syn-chronized 一 样 的 语义 ， 包 括 : 


可 重 入 ， 一 个 线程 在 持 有 一 个 锁 的 前 提 下 ， 可 以 继续 获得 该 锁 ; 
-可 以 解决 竞 态 条 件 问 题 ; 

.可 以 保证 内 存 可 见 性 

ReentrantLock 有 两 个 构造 方法 : 


public ReentrantLock() 
public ReentrantLock(boolean fair) 


参数 fair 表 示 是 否 保证 公平 ， 不 指定 的 情况 下 ， 默 认为 false， 表 示 
不 你 证 公平 。 所 谓 公平 是 指 ， 等 待 时 间 最 长 的 线程 优先 获得 锁 。 保 证 
公平 会 影响 性 能 ， 一 般 也 不 需要 ， 所 以 默认 不 保证 ， synchronized 锁 
也 是 不 保证 公平 的 ，16.2.3 节 还 会 再 分 析 实 现 细节 。 


使 用 显 式 锁 ， 一 定 要 记得 调用 unlock。 一 般 而 言 ， 应 该 将 lock 之 后 
的 代码 包装 到 try 语 句 内 ， 在 finally 语 句 内 释放 锁 。 比 如 ， 使 用 
ReentrantLock 实 现 Counter， 代 人 码 可 以 为 : 


public class Counter { 
private final Lock lock = new ReentrantLock( ) ， 
private volatile int count,; 
public void incr() { 
lock.1lock(); 


try { 
COoUunNnt++; 


} finally { 
lock.unlock(); 
} 


} 

public int getCount() { 
return count; 

} 


} 


2. 使 用 tryLock 避 免 死 锁 

使 用 tryLock () ， 可 以 避免 死 锁 。 在 持 有 一 个 锁 获 取 另 一 个 锁 而 
获取 不 到 的 时 候 ， 可 以 释放 已 持 有 的 锁 ， 给 其 他 线程 获取 锁 的 机 会 ， 
然后 重 试 获 取 所 有 锁 。 


我 们 来 看 个 例子 ， 银 行 账户 之 间 转 账 ， 用 类 Account 表 示 账 户 ， 如 
代码 清单 16-3 所 示 。 


代码 清单 16-3 ”表示 账户 的 类 Account 


public class Account { 
private Lock lock = new ReentrantLock(); 
private volatile double money; 
public Account(double initialMoney) { 
this.money = initialMoney; 


} 
public void add(double money) { 
lock.1lock(); 


try { 
this.money += money; 


} finally { 
lock.unlock(); 
} 


public void reduce(double money) { 
lock.1lock(); 


try { 
this.money -= money; 
} finally { 
lock.unlock(); 
} 


} 

public double getMoney() { 
return money; 

} 


void lock() { 
lock.1lock(); 


} 
void unlock() { 
lock.unlock(); 


boolean tryLock() { 
return lock.tryLock(); 
} 


Account 里 的 money 表 示 当 前 余额 ，add/reduce 用 于 修改 余额 。 在 账 
户 之 间 转 账 ， 需 要 两 个 账户 都 锁定 ， 如 采 不 使 用 tryLock， 而 直接 使 用 
lock， 则 代码 如 代码 清单 27-6 所 示 。 


代码 清单 16-4 ”转账 的 错误 写法 


public class AccountMgr { 
public static class NoEnoughMoneyException extends Exception {} 
public static void transfer(Account from, Account to, double money) 
throws NoEnoughMoneyException { 
from.1lock( ); 


try { 
to.1lock(); 
try { 


if(from.getMoney() >= money) { 
from.reduce(money); 
to.add(money); 

} else { 
throw new NoEnoughMoneyException(); 


} 
} finally { 
to.unlock(); 


} 
} finally { 
from.unlock(); 
} 


但 这 么 写 是 有 问题 的 ， 如 果 两 个 账户 都 同时 给 对 方 转账 ， 都 先 获 
取 了 第 一 个 锁 ， 则 会 发 生死 锁 。 我 们 写 段 代码 来 模拟 这 个 过 程 ， 如 代 
码 清 单 16-5 所 示 。 


代码 清单 16-5 ”模拟 账户 转账 的 死 锁 过 程 


public static void SimulateDeadLock() { 
final Int accountNum = 10， 
final Account[] accounts = new Account[accountNum] ， 
final Random rnd = new Random( ) ， 
for(int i = 0; i < accountNum; i++) 
accounts[i] = new Account(rnd.nextInt(10000)); 


} 
int threadNum = 100; 
Thread[] threads = new Thread[threadNum]; 
for(int i = 0; i < threadNum; i++) { 
threads[i] = new Thread() { 
public void run() { 
int loopNum = 100; 
for(int k = 0; k < loopNum; k++) { 
int i = rnd.nextInt(accountNum); 
int j = rnd.nextInt(accountNum); 


transfer(accounts[i], accounts[j], money); 
} catch (NoEnoughMoneyException e) { 
} 
} 
} 
} 


}; 
threads[i].start(); 


以 上 代码 创建 了 10 个 账户 ，100 个 线程 ， 每 个 线程 执行 100 次 循 
环 ， 在 每 次 循环 中 ， 随 机 挑选 两 个 账户 进行 转账 。 在 笔者 的 计算 机 
中 ， 每 次 执行 该 段 代 码 都 会 发 生死 锁 。 读 者 可 以 更 改 这 些 数 值 进行 试 


验 。 


我 们 使 用 tryLock 来 进行 修改 ， 先 定义 一 个 tryTransfer 方 法 ， 如 代 
码 清单 16-6 所 示 。 


代码 清单 16-6 ”使 用 tryLock 演 试 转账 


public static boolean tryTransfer(Account from, Account to, double money) 
throws NoEnoughMoneyException { 


if(from.tryLock()) 区 
try { 
if(to.tryLock()) { 
try { 

if(from.getMoney() >= money) { 
from.reduce(money); 
to.add(money); 

} else { 
throw new NoEnoughMoneyException(); 


return true; 
} finally { 
to.unlock(); 


} 
} finally { 
from.unlock(); 


return false,; 


} 


如 有 条 两 个 锁 都 能 够 获得 ， 且 转账 成 功 ， 则 返回 true， 否 则 返回 
false。 不 管 怎 样 ， 结 束 都 会 释放 所 有 锁 。transfer 方 法 可 以 循环 调用 该 
方法 以 避免 死 锁 ， 代 码 可 以 为 : 


public static void transfer(Account from, Account to, double money ) 
throws NoEnoughMoneyException { 
boolean success = false; 
do { 
success = tryTransfer(from, to, money); 
if(!success) { 
Thread.yield(); 


} 
} while (!success),; 


除了 实现 Lock 接 口中 的 方法 ，ReentrantLock 还 有 一 些 其 他 方法 ， 
通过 它们 ， 可 以 获取 关于 锁 的 一 些 信息 ， 这 些 信 息 可 以 用 于 监控 和 调 
试 目的， 具体 可 参看 API 文 档 ， 就 不 介绍 了 。 


16.2.3 ”ReentrantLock 的 实现 原理 


ReentrantLock 的 用 法 是 比较 简单 的 ， 它 是 怎么 实现 的 呢 ? 在 最 底 
层 ， 它 依赖 于 16.1 市 介绍 的 CAS 方 法 ， 男 外 ， 它 依赖 于 类 LockSupport 
中 的 一 些 方法 。 我 们 先 介 绍 Lock-Support 。 


1.LockSupport 


类 LockSupport 也 位 于 包 java.util.concurrent.locks 下 ， 它 的 基本 方法 


public static void park() 

public static void parkNanos(long nanos) 
public static void parkUntil(long deadline) 
public static void unpark(Thread thread) 


si 进入 等 待 状态 (WAITING) ， 操 作 
系统 不 再 对 它 进 行 调 度 ， 什么 卫 候 再 鹿 度 呢 ? 有 其 他 线程 对 它 调用 了 
unpark，unpark 使 参数 指定 的 线程 恢复 可 运行 状态 。 我 们 看 个 例子 : 


public static void main(String[] args) throws InterruptedException { 
Thread t = new Thread (){ 
public void run(){ 
LockSupport .park(); // 放 弃 CPU 
System.out.printjn("exit"); 


}; 
t.start(); // 启 动 子 线程 
Thread. sleep(1000); // 睡 眠 1 秒 确 保 子 线程 先 运行 
LockSupport ,unpark(t) ， 


上 述 例 子 中 ， 主 线程 局 动 子 线程 (， 线 程 t 启 动 后 调用 park， 放 弃 
CPU， 主 线程 睡眠 1 秒 以 确保 于 线程 已 执行 LockSupport.park () ， 调 
用 unpark， 线 程 t 恢 复 运 行 ， 输 出 exit 。 


park 不 同 于 Thread. yield () ，yield 只 是 告诉 操作 系统 可 以 先 让 其 
他 线程 运行 ， 但 自己 依然 是 可 运行 状态 ， 而 park 会 放弃 调度 资格 ， 使 
线程 进入 WAITING 状 态 。 


需要 说 明 的 是 ，park 有 是 啊 应 中 断 的 ， 当 有 中 上 断 发 和 后 时 ，park 会 返 
回 ， 线 程 的 中 断 状 态 会 被 设置 。 另外 还 需要 说 明 ， park 可 能 会 无 绎 无 
故地 返回 ， 程 序 应 该 重新 检查 park 等 待 的 条 件 是 否 满足 。 


park 有 两 个 变 体 : 


-parkNanos: 可 以 指定 等 待 的 最 长 时 间 ， 参 数 是 相对 于 当前 时 间 
的 纳 秒 数 ; 


-parkUntil: 可 以 指定 最 长 等 到 什么 时 候 ， 参 数 是 绝对 时 间 ， 有 是 相 
对 于 纪元 时 的 蝇 秒 数 。 


当 等 竺 超时 的 时 候 ， 它 们 也 会 返回 。 


这 些 park 方 法 还 有 一 些 变 体 ， 可 以 指定 一 个 对 象 ， 表 示 征 由 于 该 
对 象 而 进行 等 每 的 ， 以 便于 调试 ， 通 党 传递 的 值 是 this， 比 如 : 


public static void park(Object blocker) 


LockSupport 有 一 个 方法 ， 可 以 返回 一 个 线程 的 blocker 对 象 : 


public static Object getBlocker(Thread t) 


这 些 parkunpark 方 法 是 怎么 实现 的 呢 ? 与 CAS 方 法 一 样 ， 它 们 也 
调用 了 Unsafe 类 中 的 对 应 方法 。Unsafe 类 最 终 调 用 了 操作 系统 的 APIL， 
ee 角度 ， 我 们 可 以 认为 Lock-Support 中 的 这 些 方法 就 是 基本 
艰 oO 


2.AQS 


利用 CAS 和 LockSupport 提 供 的 基本 方法 ， 束 可 以 用 来 实现 
ReentrantLock 了“。 但 Java 中 还 有 很 多 其 他 并 发 工具 ， 如 
ReentrantReadWriteLock、Semaphore、CountDownLatch， 它 们 的 实现 
有 很 多 类 似 的 地 方 ， 为 了 复 用 代码 ，Java 提 供 了 一 个 抽象 类 
AbstractQueued-Synchronizer， 简 称 AQS， 它 简化 了 并 发 工具 的 实现 。 
0 比较 复杂 ， 我 们 主要 以 ReentrantLock 的 使 用 为 例 进行 
间 女 J 个 组 ° 


AQS 封 狼 了 一 个 状态 ,给 子 类 提供 了 查询 和 设置 状态 的 方法 : 


private volatile int state,; 
protected final int getState() 


protected final void setState(int newState) 
protected final boolean compareAndSetState(int expect, int update) 


用 于 实现 锁 时 ，AQS 可 以 保存 锁 的 当前 持 有 线程 ， 提 供 了 方法 进 
行 查 询 和 设置 : 


private transient Thread exclusiveOwnerThread; 
protected final void setExclusiveOwnerThread(Thread t) 
protected final Thread getExclusiveownerThread () 


AQS 内 部 维护 了 一 个 等 竺 队列 ， 借 助 CAS 方 法 实现 了 无 阻塞 算法 
进行 更 新 。 


下 面 ， 我 们 以 ReentrantLock 的 使 用 为 例 简 要 介绍 AQS 的 原理 。 
3.ReentrantLock 


ReentrantLock 内 部 使 用 AQS， 有 三 个 内 部 类 : 


abstract static class Sync extends AbstractQueuedSynchronizer 
static final class NonfairSync extends Sync 
static final class FairSync extends Sync 


Sync 是 抽象 类 ，NonfairSync 是 fair 为 false 时 使 用 的 类 ，FairSync 是 
fire 为 true 时 使 用 的 类 。ReentrantLock 内 部 有 一 个 Sync 成 员 : 


private final Sync Sync 


在 构造 方法 中 sync 人 被 赋值 ， 比 如 : 


public ReentrantLock() { 
Sync = new NonfairSync(); 
} 


我 们 来 看 ReentrantLock 中 的 基本 方法 lock/unlock 的 实现 。 先 看 lock 
方法 ， 代 码 为 : 


public void lock() { 
sync.1lock(); 
} 


sync 默 认 类 型 是 NonfairSync，NonfairSync 的 lock 代 码 为 : 


final void lock() { 
If(compareAndSetState(0，1)) 
setExclusiveOwnerThread(Thread.currentThread( )); 
else 
acquire(1); 


ReentrantLock 使 用 state 表 示 是 否 被 锁 和 持 有 数量 ， 如 果 当 前 未 被 
锁定 ， 则 立即 获得 锁 ， 否 则 调用 acquire (1) 获得 锁 。acquire 是 AQS 中 
的 方法 ， 代 码 为 : 


public final void acquire(int arg) { 
if(!tryAcquire(arg) && 
acquireQueued(addwaiter (Node.EXCLUSIVE), arg)) 
selfIinterrupt(); 


它 调用 tryAcquire 获 取 锁 ，tryAcquire 必 须 被 子 类 重 写 。 
NonfairSync 的 实现 为 : 


protected final boolean tryAcquire(int acquires) { 
return nonfairTryAcquire(acquires); 
} 


nonfairTryAcquire 是 sync 中 实现 的 ， 代 码 为 : 


final boolean nonfairTryAcquire(int acquires) { 
final Thread current = Thread.currentThread(); 
int c = getState(); 
if(c == 0) { 
if(compareAndSetState(0, acquires)) { 
setExclusiveOwnerThread(current); 
return true; 


} 


else if(current == getExclusiveOwnerThread()) { 
int nextc = c + acquires,; 
if(nextc < 0) // overflow 


throw new Error("Maximum lock count exceeded"); 
SetState(nextc) 
return true; 


return false,; 


这 段 代码 容易 理解 ， 如 采 未 被 锁定 ， 则 使 用 CAS 进 行 锁定 ;如 采 
已 被 当前 线程 锁定 ， 则 增加 锁定 次 数 。 如 果 tryAcquire 返 回 false， 则 
AQS 会 调用 : 


acquireQueued(addwaiter (Node.EXCLUSIVE), arg) 


其 中 ，addWaiter 会 狐 建 一 个 节点 Node， 代 表 当 前 线程 ， 然 后 加 入 
内 部 的 等 竺 队列 中 ， 限 于 篇 幅 ， 有 具体 代码 就 不 列 出 来 了 。 放 入 等 待 队 
列 后 ， 调 用 acquireQueued 党 试 获 得 锁 ， 代 码 为 : 


final boolean acquireQueued(final Node node, int arg) { 
boolean failed = true; 
try { 
boolean interrupted = false; 
for(;;) { 
final Node p = node.predecessor(); 
if(p == head && tryAcquire(arg)) { 
setHead(node); 
p.next = null; // help GC 
failed = false,; 
return interrupted; 


} 

if(shouldParkAfterFailedAcquire(p, node) && 
parkAndCcheckInterrupt()) 
interrupted = true; 


} 
} finally { 
if(failed) 
cancelAcquire(node); 


} 


主体 是 一 个 死 循环 ， 在 每 次 循环 中 ， 首 先 检 查 当 前 节点 是 不 是 第 
一 个 等 得 的 节点 ， 如 采 是 且 能 获得 到 锁 ， 则 将 当前 市 点 从 等 每 队列 中 
移 除 并 返回 ， 否 则 最 终 调用 LockSupport.park 放 弃 CPU， 进 入 等 待 ， 被 
唤醒 后 ， 检 查 是 否 发 生 了 中 断 ， 记 录 中 断 标 志 ， 在 最 终 方法 返回 时 返 
回 中 断 标 志 。 如 果 发 生 过 中 断 ，acquire 方 法 最 终 会 调用 selfInterrupt 方 
法 设置 中 断 标志 位 ， 其 代码 为 : 


private static void SelfInterrupt() { 
Thread.currentThread().interrupt(); 
} 


以 上 就 是 lock 方 法 的 基本 过 程 ， 能 获得 锁 束 立即 获得 ， 否 则 加 入 
等 竺 队列， 被 唤醒 后 检查 目 己 是 否 是 第 一 个 等 待 的 线程 ， 如 采 征 且 能 
获得 山 ， 则 返回 ， 否 则 继续 等 待 。 这 个 过 程 中 如 果 发 生 了 中 断 ，lock 
会 记录 中 断 标 志 位 ， 但 不 会 提前 返回 或 抛 出 异 第 。 


ReentrantLock 的 unlock 方 法 的 代码 为 : 


public void unlock() { 
sync.release(1); 


release 是 AQS 中 定义 的 方法 ， 代 码 为 : 


public final boolean release(int arg) { 
if(tryRelease(arg)) { 
Node h = head; 
if(h != null && h,waitStatus != 0) 
unparkSuccessor(h); 
return true; 


return false,; 


tryRelease 方 法 会 修改 状态 释放 锁 ，unparkSuccessor 会 调用 
LockSupport.unpark 将 第 一 个 等 得 的 线程 唤醒 ， 具体 代码 束 不 列举 了 了。 


FairSync 和 NonfairSync 的 主要 区 别 是 : 在 获取 锁 时 ， 即 在 
tryAcquire 方 法 中 ， 如 果 当 前 未 被 锁定 ， 即 c==0，FairSync 多 了 一 个 检 
查 ， 如 下 : 


protected final boolean tryAcquire(int acduires) { 

final Thread current = Thread.currentThread(); 

int c = getState() 

if(c == 0) { 

if(!hasQueuedPredecessors() && 

compareAndSetState(0, acquires)) { 
setExclusiveOwnerThread(current); 
return true; 


- cm 


这 个 检查 是 指 ， 只 有 不 存在 其 他 等 每 时 间 更 长 的 线程 ， 它 才 会 笑 
试 获取 锁 。 


这 样 保证 公平 不 是 很 好 吗 ? 为 什么 默认 不 保证 公平 呢 ? 保证 公平 
整体 性 能 比较 低 ， 低 的 原因 不 是 这 个 检查 慢 ， 而 是 会 让 活跃 线程 得 不 
到 锁 ， 进 入 等 待 状态 ，3 引 起 频繁 上 下 文 切换 ， 降 低 了 整体 的 效率 ， 通 
常情 况 下 ， 谁 先 运行 天 系 不 大 ， 而 且 长 时 间 运 行 ， 从 统计 角度 而 言 ， 
虽然 不 保证 公平 ， 也 基本 是 公平 的 。 需 要 说 明 是 ， 即 使 fair 参 数 为 
true，ReentrantLock 中 不 市 参数 的 tryLock 方 法 也 是 不 保证 公平 的 ， 它 
不 会 检查 是 否 有 其 他 等 竺 时间 更 长 的 线程 。 


16.2.4 对 比 ReentrantLock 和 synchronized 


相 比 synchronized，ReentrantLock 可 以 实现 与 synchronized 相 同 的 
语义 ， 而 且 文 持 以 非 阻塞 方式 获取 锁 ， 可 以 啊 应 中 断 ， 可 以 限时 ， 更 
不 过 ，synchronized 的 使 用 更 为 简单 ， 写 的 代码 更 少 ， 也 更 不 
容 着 。 


synchronized 代 表 一 种 声明 式 编 程 思维 ， 程序 员 更 多 的 是 表达 一 
种 同步 声明 ， 由 Java 系 统 负责 具体 实现 ， 程 序 员 不 知道 其 实现 细 ; 
显 式 锁 代 表 一 种 命令 式 编程 思维 ， 程序 员 实现 所 有 细节 。 


声明 式 编程 的 好 处 除了 人 简单， 还 在 于 性 能 ， 在 较 新 版 本 的 JVM 
上 ，ReentrantLock 和 synchronized 的 性 能 是 接近 的 ， 但 Java 编 译 络 和 虚 
拟 机 可 以 不 断 优 化 synchronized 的 实现 ， 比如 目 动 分 析 synchronized 的 
使 用 ， 对 于 没有 锁 竞 争 的 场景 ， 目 动 省 略 对 锁 获 取 / 释 放 的 调用 。 


简单 总 结 下 ， 能 用 synchronized 就 用 synchronized， 不 满足 要 求 时 
再 考虑 Reentrant-Lock 。 


16.3” 显 式 条 件 


16.2 廊 我 们 介绍 了 显 式 锁 ， 本 市 介绍 关联 的 显 式 条 件 ， 介 绍 其 用 
法 和 原理 。 显 式 条 件 在 不 同上 下 文中 也 可 以 被 称 为 条 件 变 量 、 条 件 队 
列 、 或 条 件 ， 后 文 我 们 可 能 会 交 蕉 使 用 。 


16.3.1 用 法 


锁 用 于 解决 况 态 条 件 问 题 ， 条 件 是 线程 间 的 协作 机 制 。 显 式 锁 与 
synchronized 相 对 应 ， 而 显 式 条 件 与 wait/notify 相 对 应 。wait/notify 与 
synchronized 配 合 使 用 ， 显 式 条 件 与 显 式 锁 配 合 使 用 。 条 件 与 锁 相 关 
联 ， 创 建 条 件 变 量 需 要 通过 显 式 锁 ，Lock 接 口 定义 了 创建 方法 : 


Condition newCondition(); 


Condition 表 示 条 件 变量 ， 是 一 个 接口 ， 它 的 定义 为 : 


public interface Condition { 
void await() throws InterruptedException,; 
void awaitUninterruptibly(); 
long awaitNanos(long nanosTimeout) throws InterruptedException,; 
boolean await(long time, TimeUnit unit) throws InterruptedException,; 
boolean awaitUntil(Date deadline) throws InterruptedException,; 
void signal(); 
void signalAll(); 


await 对 应 于 Object 的 wait，signal 对 应 于 notify，signalAl 对 应 于 
notifyAll， 语 义 也 是 一 样 的 。 


与 Object 的 wait 方 法 类 似 ，await 也 有 几 个 限定 等 待 时间 的 方法 ， 
但 功能 更 多 一 些 : 


// 等 待 时 间 是 相对 时 间 ， 如 于 等 待 超时 返回 ， 返 回 值 为 false， 否 则 为 true 

boolean await(long time, TimeUnit unit) throws InterruptedException,; 
// 等 待 时 间 也 是 相对 时 间 ， 但 参数 单位 是 纳 秒 ， 返 回 值 是 nanosTimeout 减 去 实际 等 待 的 时 间 
long awaitNanos(long nanosTimeout) throws InterruptedException,; 


// 等 待 时 间 是 绝对 时 间 ， 如 果 由 于 等 待 超时 返回 ， 返 回 值 为 false， 否 则 为 true 
boolean awaitUntil(Date deadline) throws InterruptedException; 


这 些 await 方 法 都 是 啊 应 中 汤 的 ， 如 有 果 发 生 了 中 汤 ， 会 抛 出 
InterruptedException， 但 中 断 标 志 位 会 被 清空 。Condition 还 定义 了 一 个 
不 响应 中 断 的 等 得 方法 : 


void awaitUninterruptibly(); 


该 方法 不 会 由 于 中 断 结束 ， 但 当 它 返回 时 ， 如 果 等 待 过 程 中 发 生 
了 中 断 ， 中 断 标志 位 会 被 设置 。 


一 般 而 言 ， 与 Object 的 wait 方 法 一 样 ， 调 用 await 方 法 前 需要 先 获 
取 锁 ， 如 有 果 没 有 锁 ， 会 抛 出 异常 IlegalMonitorStateException 。 


await 在 进入 等 待 队列 后 ， 会 释放 锁 ， 释 放 CPU， 当 其 他 线程 将 它 
唤醒 后 ， 或 等 待 超时 后 ， 或 发 生 中 断 异 常 后 ， 它 都 需要 重新 获取 锁 ， 
获取 锁 后 ， 才 会 从 await 方 法 中 退出 。 


另外 ， 与 Object 的 wait 方 法 一 样 ，await 返 回 后 ， 不 代表 其 等 竺 的 
条 件 束 一 定 满足 了 了， 通常 要 将 await 的 调用 放 到 一 个 循环 内 ， 只 有 条 件 
满足 后 才 退 出 。 


一 般 而 言 ，signal/signalAll 与 notify/notifyAll 一 样 ， 调 用 它们 需要 
先 获 取 锁 ， 如 果 没 有 锁 ， 会 抛 出 异常 IllegalMonitorStateException 。 
signal 与 notify 一 样 ， 挑 选 一 个 线程 进行 唤醒 ，signalAll 与 notifyAll 一 
样 ， 唤 醒 所 有 等 符 的 线程 ， 但 这 些 线程 被 唤醒 后 都 需要 重新 竞争 锁 ， 
获取 锁 后 才 会 从 await 调 用 中 返回 。 


ReentrantLock 实 现 了 newCondition 方 法 ， 通 过 它 ， 我 们 来 看 下 条 
件 的 基本 用 法 。 我 们 实现 与 15.3 广 类 似 的 例子 WaitThread， 一 个 线程 启 
动 后 ， 在 执行 一 项 操作 前 ， 等 待 主线 程 给 它 指 令 ， 收 到 指令 后 才 执 
行 ， 示 例 代 码 如 代码 清单 16-7 所 示 。 


代码 清单 16-7 使 用 显 式 条 件 进行 协作 的 示例 


public class WaitThread extends Thread { 
private volatile boolean fire = false,; 


private Lock lock = new ReentrantLock(); 
private Condition condition = lock.newCondition(); 
Q@override 
public void run() { 
try { 
lock.1lock( ); 
try { 
while (!fire) { 
condition.await(); 


} 
} finally { 
lock.unlock(); 


System,out,printJln("fired") ， 

} catch (InterruptedException e) { 
Thread ,interrupted() ， 

} 


} 


public void fire() { 

lock.1lock(); 

try { 
this,.fire = true; 
condition.signal(); 

} finally { 
lock.unlock(); 

} 


public static void main(String[] args) throws InterruptedException { 
WaitThread waitThread = new WaitThread(); 
waitThread,. start(); 
Thread.sleep(1000); 
System.out.printjn("fire"); 
waitThread.fire( ); 


需要 特别 注意 的 是 ， 不 要 将 signal/signalAll 与 notify/notifyAll 混 
消 ，notify/notifyAl 是 Object 中 定义 的 方法 ，Condition 对 象 也 有 ， 稍 不 
注意 就 会 误 用 。 比如 ， 对 上 面 例子 中 的 fire 方 法 ， 可 能 会 写 为 : 


public void fire() { 

lock.1lock(); 

try { 
this.fire = true; 
condition.notify(); 

} finally { 
lock.unlock(); 

} 


写成 这 样 ， 编 译 铝 不 会 报销， 但 运行 时 会 抛 出 
IlegalMonitorStateException， 因 为 notify 的 调用 不 在 synchronized 语 句 


内 。 同 样 ， 避 人 免 将 锁 与 synchronized 混 用 ， 那 样 非常 令 人 混淆， 比如 : 


public void fire() { 
synchronized(lock)t{ 
this,.fire = true; 
condition.signal(); 
} 
} 


记 住 ， 显 式 条 件 与 显 式 锁 配合 ，wait/notify 与 synchronized 配 合 。 
16.3.2” 宇 产 省 / 消 禄 着 借 区 


在 15.3 节 ， 我 们 用 waitnotify 实 现 了 生产 者 /消费 者 模式 ， 我 们 提 到 
了 waitnotify 的 一 个 局 限 ， 它 只 能 有 一 个 条 件 等 竺 队列 ， 分 析 等 竺 条 件 
也 很 复杂 。 在 生产 者 /消费 者 模式 中 ， 其 实 有 两 个 条 件 ， 一 个 与 队列 满 
有 关 ， 一 个 与 队列 空 有 关 。 使 用 显 式 锁 ， 可 以 创建 多 个 条 件 等 待 队 
4 。 我 们 用 显 式 锁 / 条 件 重 新 实现 下 其 中 的 阻塞 队列 ， 如 代码 清 
16-8 所 示 。 


代码 清单 16-8 ”使 用 显 式 锁 / 条 件 实现 的 阻塞 队列 


static class MyBlockingQueue<E> { 
private Queue<E> queue = null; 
private int limit; 
private Lock lock = new ReentrantLock(); 
private Condition notFull = lock.newCondition(); 
private Condition notEmpty = lock.newCondition(); 
public MyBlockingQueue(int limit) { 
this,1Limit = limit,; 
dueue = new ArrayDeque<>(1imit); 


public void put(E e) throws InterruptedException { 
lock.lockInterruptibly(); 
try{ 
while (queue.size() == limit) { 
notFull.await( ); 


queue.add(e); 
notEmpty.signal( ); 
}finally{ 
lock.unlock(); 
} 


public E take() throws InterruptedException { 
lock.lockInterruptibly(); 
try{ 


while(queue.isEmpty()) { 
notEmpty .await(); 
} 


E e = queue.poll()， 
notFull.signal(); 
return e; 

}finally{ 
lock.unlock(); 

} 

} 
} 


上 上述 代 码 定义 了 两 个 等 待 条 件 ， 不满 (notFull) 、 不 空 
(notEmpty) 。 在 put 方 法 中 ， 如 果 队 列 满 ， 则 在 notFull 上 等 待 ， 在 
take 方 法 中 ， 如 果 队 列 空 ， 则 在 notEmpty 上 等 待 。put 操 作 后 通知 
notEmpty，take 操 作 后 通知 notFul。 这 样 ， 代 码 更 为 清晰 易 读 ， 同 时 避 
免 了 不 必要 的 唤醒 和 检查 ， 提 高 了 效率 。Java 并 发 包 中 的 类 
ArrayBlockingQueue 束 采用 了 类 似 的 方式 实现 。 


16.3.3 ”实现 原理 


理解 了 显 式 条 件 的 概念 和 用 法 ， 我 们 来 看 下 ReentrantLock 是 如 何 
实现 它 的 ， 其 new-Condition () 的 代码 为 : 


public Condition newCondition() { 
return sync.newCondition(); 


sync 是 ReentrantLock 的 内 部 类 对 象 ， 其 newCondition () 代码 为 : 


final Conditionobject newCondition() { 
return new ConditionObject(); 
} 


ConditionObject 是 AQS 中 定义 的 一 个 内 部 类 ， 它 的 实现 也 比较 复 
杂 ， 我 们 通过 一 些 主要 代码 来 商 要 探讨 其 实现 原理 。ConditionObject 
内 部 也 有 一 个 队列 ， 表 示 条 件 等 竺 队列 ， 其 成 员 声 明 为 : 


/V 条 件 队列 的 头 节 点 


private transient Node firstwaiter,; 


// 条 件 队列 的 尾 节 点 


private transient Node lastwaiter; 


ConditionObject 是 AQS 的 成 员 内 部 类 ， 它 可 以 直接 访问 AQS 中 的 
数据 ， 比 如 AQS 中 定义 的 锁 等 竺 队列 。 我 们 看 下 主要 方法 的 实现 。 移 
如 代码 清单 16-9 所 示 。 我 们 通过 添加 注释 解释 其 基本 思 


代码 清单 16-9”await 的 实现 代码 


public final void await() throws InterruptedException { 
// 如 果 等 待 前 中 断 标志 位 已 被 设置 ， 直 接 抛 出 异常 
if(Thread.interrupted()) 
throw new InterruptedException(); 
//1. 为 当前 线程 创建 节点 ， 加 入 条 件 等 待 队列 
Node node = addConditionwaiter(); 
//2 .释放 持 有 的 锁 
int savedState = fullyRelease(node); 
int interruptMode = 0; 
//3 .放弃 CPU， 进 行 等 待 ， 直 到 被 中 断 或 isOnSyncQueue 变 为 true 
//isonSsyncQueue 为 true， 表 示 节 点 被 其 他 线程 从 条 件 等 竺 队列 
// 移 到 了 外 部 的 锁 等 待 队 列 , 等 待 的 条 件 已 满足 
while (!isOnSyncQueue(node)) { 
LockSupport.park(this); 
if((interruptMode = checkInterruptwhilewaiting(node)) != 0) 
break; 


} 

//4. 重 新 获取 锁 

if(acquireQueued(node, savedState) && interruptMode != THROW_IE) 
interruptMode = REINTERRUPT ， 

if(node.nextwaiter != null) // clean up if cancelled 
unlinkCancelledwaiters(); 

//5 .处 理 中 断 ， 抛 出 异常 或 设置 中 断 标志 位 

if(interruptMode != 0) 
reportInterruptAfterwait(interruptMode); 


awaitNanos 与 await 的 实现 是 基本 类 似 的 ， 区 别 主要 是 会 限定 等 待 
的 时 间 ， 具 体 就 不 列举 了 。 


signal 方 法 代码 为 : 


public final void signal( ) { 

// 验 证 当前 线程 持 有 锁 

if(!isHeldExclusively()) 
throw new IllegalMonitorStateException(); 
// 调 用 doSignal 唤 醒 等 待 队列 中 第 一 个 线程 
Node first = firstwaiter,; 
if(first != null) 


dosignal(first); 


doSignal 的 代码 就 不 列举 了 ， 其 基本 逻辑 是 : 
1) 将 节点 从 条 件 等 待 队 列 移 到 锁 等 待 队列 ; 


2) 调用 LockSupport.unpark 将 线程 唤醒 。 
16.3.4 小结 


本 厄 介 绍 了 显 式 条 件 的 用 法 和 实现 原理 。 它 与 显 式 锁 配 合 使 用 ， 
与 wait/notify 相 比 ， 可 以 支持 多 个 条 件 队 列 ， 代 码 更 为 易 读 ， 效 率 更 
高 ， 使 用 时 注意 不 要 将 signal/signalAll 误 写 为 notify/notifyAll。 


至 此 ， 天 于 并 发 包 的 基础 :原子 变量 和 CAS、 显 式 尔 和 条 件 ， 束 
介绍 完了 ， 基 于 这 些 ，Java 并 发 包 还 提供 了 很 多 更 为 易 用 的 高 层 数 据 
结构 、 工 具 和 服务 ， 下 一 革 ， 我 们 介绍 一 些 并 发 容器 。 


第 17 革 并 发 容 右 
本 章 ， 我 们 探讨 Java 并 发 包 中 的 容器 类 ， 具 体 包括 : 
` 写 时 复制 的 List 和 Set; 
-ConcurrentHashMap; 
.基于 SkipList 的 Map 和 Set; 
-各 种 并 发 队列 。 


它们 都 有 什么 用 ? 如 何 使 用 ? 与 普通 容 需 类 相 比 ， 有 哪些 特点 ? 
征 如 何 实现 的 ? 本 章 进 行 详细 讨论 。 


17.1 写 时 复制 的 List 和 Set 


本 市 和 完 介绍 两 个 简单 的 类 : CopyOnWriteArrayList 和 
CopyOnWriteArraySet， 讨 论 它们 的 用 法 和 实现 原理 。 它 们 的 用 法 比较 
人 简单， 我 们 需要 理解 的 是 它们 的 实现 机 制 。Copy-On-Write 即 写 时 复 
制 ， 或 称 写 时 拷贝 ,这 是 解决 并 发 问题 的 一 种 重要 思路 。 


17.1.1 CopyOnWriteArrayList 


CopyOnWriteArrayList 实 现 了 List 接 口 ， 它 的 用 法 与 其 他 List (如 
ArrayList) 基本 是 一 样 的 。CopyOnWriteArrayList 的 特点 如 下 : 


征 线 程 安全 的 ， 可 以 被 多 个 线程 并 发 访问 ; 
它 的 欠 代 亏 不 文 持 修 改 操作 ， 但 也 不 会 抛 出 


ConcurrentModificationException:; 


' 它 以 原子 方式 文 持 一 些 复合 操作 。 


我 们 在 15.2.3 太 提 到 过 基于 synchronized 的 同步 容 妮 的 儿 个 问题 。 
友 代 时 ， 需 要 对 整个 列表 对 象 加 锁 ， 否 则 会 抛 出 
ConcurrentModificationException，CopyOnWriteArrayList 没 有 这 个 问 
迭代 时 不 需要 加 锁 。 


基于 synchronized 的 同步 容 需 的 另 一 个 问题 是 复合 操作 ， 比 如 先 检 
也 需要 调用 方 加 锁 ， 而 CopyOnWriteArrayList 直 接 文 持 两 个 
原子 Y : 


// 不 存在 才 添加 ， 如 果 添 加 了 ， 返 回 true， 人 否则 返回 false 
public boolean addIfAbsent (E e) 

// 批 量 添加 c 中 的 非 重复 元 素 ， 不 存在 才 添 加 ， 返 回 实际 添加 的 个 数 
public int addAllAbsent(Collection<? extends E> c) 


CopyOnWriteArrayList 的 内 部 也 是 一 个 数组 ， 但 这 个 数组 是 以 原子 
方式 被 整体 更 新 的 。 每 次 修改 操作 ， 都 会 新 建 一 个 数组 ， 复 制 原 数 组 


的 内 容 到 新 数组 ， 在 新 数组 上 进行 需要 的 修改 ， 然 后 以 原子 方式 设置 
内 部 的 数组 引用 ， 这 束 是 写 时 复制 。 


所 有 的 读 操作 ， 都 是 先 拿 到 当前 引用 的 数组 ， 然 后 直接 访问 该 数 
组 。 在 读 的 过 程 中 ， 可 能 内 部 的 数组 引用 已 经 被 修改 了 ， 但 不 会 影响 
读 操 作 ， 它 依旧 访问 原 数 组 内 容 。 

换 句 话说 ， 数 组 内 容 是 只 读 的 ， 写 操作 都 是 通过 新 建 数组 ， 然 后 
原子 性 地 修改 数组 引用 来 实现 的 。 下 面 我 们 通过 代码 具体 介绍 (基于 
Java 7) ， 包 括 内 部 组 成 、 构 造 方法 、add 方 法 和 indexOf 方 法 。 


内 部 数组 声明 为 : 


private volatile transient Object[] array; 


注意 : 它 声明 为 了 volatile， 这 征 必 需 的 ， 以 保证 内 存 可 见 性 ， 即 
您 证 在 写 操 作 虽 改 之 后 甘 澡 作 能 有 到 。 有 两 个 方法 用 来 访问 /设置 该 数 
组 : 


final Object[] getArray() { 
return array; 


final void setArray(Object[] a) { 
array = a; 


} 


在 CopyOnWriteArrayList 中 ， 读 不 需要 锁 ， 可 以 并 行 ， 读 和 写 也 可 
以 并 行 ， 但 多 个 线程 不 能 同时 写 ， 每 个 写 操作 都 需要 多 获取 锁 。 
CopyOnWriteArrayList 内 部 使 用 Reentrant-Lock， 成 员 声 明 为 : 


transient final ReentrantLock lock = new ReentrantLock(); 


默认 构造 方法 为 : 


public CopyOnWwriteArrayList() { 
setArray(new Object[0]); 


上 述 代 码 束 是 设置 了 一 个 空 数 组 。 
add 方 法 的 代码 为 : 


public boolean add(E e) { 

final ReentrantLock lock = this.lock; 

lock.1lock( ); 

try { 
Object[] elements = getArray(); 
int len = elements.1length,; 
Object[] newElements = Arrays.copyof (elements, len + 1); 
newElements[len|] = e,; 
setArray(newElements); 
return true; 

} finally { 
lock.unlock(); 

} 


} 


上 述 代码 也 容易 理解 ，add 方 法 是 修改 操作 ， 整 个 过 程 需要 被 锁 保 
护 ， 先 获取 当前 数组 elements， 然 后 复制 出 一 个 长 度 加 1 的 新 数组 
人 ， 在 新 数组 中 添加 元 素 ， 最 后 调用 setArray 原 子 性 地 修改 
部 数组 引用 。 


查找 元 素 indexOf 的 代码 为 : 


public int indexof(Object o) { 
Object[] elements = getArray(); 
return indexof(o, elements, 0, elements.length); 


} 


先 获取 当前 数组 elements， 然 后 调用 另 一 个 indexOf 进 4 0 有 其 
体 代码 束 不 列举 了 。 个 indexOf 方 兴 访 问 的 所 有 数据 都 是 通过 参数 传 
递 进来 的 ， 数 组 内 容 也 不 会 被 修改 ， 不 存在 并 发 问题 。 


每 次 修改 都 要 创建 一 个 新 数组 ， 然 后 复制 所 有 内 容 ， 这 听 上 去 是 
一 个 难以 令 人 接受 的 方案 ， 如 有 果 数 组 比较 大 ， 修 改 操作 又 比较 频繁 ， 
可 以 想象 ， CopyOnWiiteArrayList 的 ， 隆 能 是 很 低 的 。 事 实 确实 如 此 ， 
CopyOnWriteArrayList 不 适用 于 数组 很 大 日 修改 频繁 的 场景 。 它 是 以 优 
和 读 不 需要 同步 ， 性 能 很 高 ， 但 在 优化 读 的 同时 牺 


之 前 我 们 介绍 了 保证 线程 安全 的 两 种 思路 : 一 种 是 锁 ， 使 用 
synchronized 或 Reentrant-Lock; 另外 一 种 是 循环 CAS， 写 时 复制 体现 
了 保证 线程 安全 的 男 一 种 思路 。 锁 和 循环 CAS 都 是 控制 对 同一 个 资源 
的 访问 冲突 ， 而 写 时 复制 通过 复制 资源 减少 冲突 。 对 于 绝 大 部 分 访问 
都 是 读 ， 且 有 大 量 并 发 线程 要 求 读 ， 只 有 个 别 线程 进行 写 ， 且 只 是 偶 
尔 写 的 场合 ， 写 时 复制 就 是 一 种 很 好 的 解决 方案 。 


写 时 复制 是 一 种 重要 的 思维 ， 用 于 各 种 计算 机 程序 中 ， 比 如 操作 
系统 内 部 的 进程 管理 和 内 存 管理 。 在 进程 管理 中 ， 子 进程 经 常 共 诗 父 
进程 的 资源 ， 只 有 在 写 时 才 复 制 。 在 内 存 管理 中 ， 当 多 个 程序 同时 访 
问 同 一 个 文件 时 ， 操 作 系 统 在 内 存 中 可 能 只 会 加 载 一 份 ， 只 有 程序 要 
写 时 才 会 复制 ， 分 配 目 己 的 内 存 ， 复 制 可 能 也 不 会 全 部 复制 ， 只 会 复 
制 写 的 位 置 所 在 的 页 趾 。 


17.1.2 CopyOnWriteArraySet 


CopyOnWriteArraySet 实 现 了 Set 接 口 ， 不 包含 重复 元 素 ， 使 用 比较 
简单 ， 我 们 吏 不 性 述 了 。 下 面 ， 主 要 介绍 其 内 部 组 成 ， 以 及 add 与 
contains 方 法 的 代码 。CopyOnWriteArraySet 内 部 是 通过 
CopyOnWriteArrayList 实 现 的 ， 其 成 员 声 明 为 : 


private final CopyOnwriteArrayList<E> al; 


在 构造 方法 中 被 初始 化 ， 如 : 


public CopyonwriteArraySet() { 
al = new CopyOnwriteArrayList<E>(); 
} 


其 add 方 法 代码 为 : 


public boolean add(E e) { 
return al.addIfAbsent(e); 
} 


add 方 法 就 是 调用 了 CopyOnWriteArrayList 的 addIfAbsent 方 法 。 


contains 方 法 代码 为 : 


public boolean contains(Object o) { 
return al.contains(o); 


} 


由 于 CopyOnWriteArraySet 是 基于 CopyOnWriteArrayList 实 现 的 ， 
所 以 与 之 前 介绍 过 的 Set 的 实现 类 如 HashSet/TreeSet 相 比 ， 它 的 性 能 比 
较 低 ， 不 适用 于 元 素 个 数 特别 多 的 集合 。 如 有 果 元 素 个 数 比 较 多 ， 可 以 
竹 谍 ConcurrentHashMap 或 ConcurrentSkipListSet 这 两 个 关 ， 我 们 稍 后 
介绍 。 


简单 总 结 下 ，CopyOnWriteArrayList 和 CopyOnWriteArraySet 适 用 
于 读 远 多 于 写 、 集 合 不 太 大 的 场合 ， 它 们 采用 了 写 时 复制 ， 这 是 计算 
机 程序 中 一 种 重要 的 思维 和 技术 。 


ee 具体 大 小 与 系统 有 关 ， 典 型 大 
小 为 4KB 。 


17.2 ConcurrentHashMap 


本 节 介 绍 一 个 常用 的 并 发 容器 ConcurrentHashMap， 它 是 HashMap 
的 并 发 版 本 ， 与 HashMap 相 比 ， 它 有 如 下 特点 : 


并 发 安全 ; 
.直接 文 持 一 些 原 子 复合 操作 ; 
文 持 高 并 发 ， 读 操作 完全 并 行 ， 写 操作 文 持 一 定 程 度 的 并 行 ; 


:与 同步 容器 Collections.synchronizedMap 相 比 ， 送 代 不 用 加 锁 ， 不 
会 抛 出 ConcurrentModificationException; 


- 弱 一 致 性 。 
下 面 我 们 分 别 介绍 。 
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需要 了 解 的 是 ，HashMap 不 是 并 发 安全 的 ， 在 并 发 更 新 的 情况 
隐 占 满 CPU。 我 们 看 个 例子 ， 如 代码 清 
17-1 所 示 。 


代码 清单 17-1 HashMap 死 循环 示例 


public static void unsafeConcurrentUpdate() { 
final Map<Integer, Integer> map = new HashMap<>(); 
for(int i = 0; i < 1000; i++) { 
Thread t = new Thread() { 
Random rnd = new Random(); 
@Override 
public void run() { 
for(int i = 0; i < 1000; i++) { 
map.put(rnd.nextInt(), 1); 


} 


}; 
t.start(); 


运行 上 面 的 代码 ， 在 笔者 的 计算 机 中 ， 无 论 是 Java 7 还 是 Java 8 环 
境 ， 每 次 都 会 出 现 死 循环 ， 占 满 CPU 。 


为 什么 会 出 现 死 循 环 呢 ? 和 死 循 环 出 现在 多 个 线程 同时 扩容 哈 希 表 
的 时 候 ， 不 是 同时 更 新 一 个 链 表 的 时 候 ， 那 种 情况 可 能 会 出 现 更 新 丢 
失 ， 但 不 会 死 循环 ， 具 体 过 程 比 较 复杂 ， 我 们 就 不 解释 了 。 关 于 Java 7 
的 解释 感 兴趣 的 读者 可 以 参考 http://coolshell.cn/articles/9606.html 中 的 
。 Java 8 对 HashMap 的 实现 进行 了 大 量 优化 ， 减 少 了 死 循环 的 可 
， 但 在 扩容 的 时 候 还 是 可 能 有 人 死 循环 。 


使 用 Collections.synchronizedMap 方 法 可 以 生成 一 个 同步 容器 ， 以 
避免 产生 和 死 循 环 ， 和 替换 第 一 行 代 码 即 可 : 


final Map<Integer, Integer> map = new ConcurrentHashMap<>( ) ; 


同步 容 郁 有 儿 个 问题 : 
-每 个 方法 都 需要 同步 ， 文 持 的 并 发 度 比较 低 ; 


人 需要 调用 方 加 锁 ， 使 用 比较 奢 烦 ， 且 容易 
,/ 避 JD ” 


ConcurrentHashMap 没 有 这 些 问题 ， 它 同样 实现 了 Map 接 口 ， 也 是 
基于 哈 硕 表 实现 的 ， 上 面 的 代码 替换 第 一 行 即 可 : 


final Map<Integer, Integer> map = new ConcurrentHashMap<>(); 


17.2.2 原子 复合 操作 


除了 Map 接 口 ，ConcurrentHashMap 还 实现 了 一 个 接口 
接 口 定义 了 一 些 条 件 更 新 操作 ，Java 7 中 的 具体 定义 


public interface ConcurrentMap<K，V> extends Map<K, V> { 
// 条 件 更 新 ， 如 果 Map 中 没有 key， 设 置 key 为 value， 返 回 原来 key 对 应 的 值 ， 


// 如 果 没 有 ， 返 回 nu11 
V putIfAbsent(K key, V Value ) ， 
// 条 件 删 除 ， 如 果 Map 中 有 key， 且 对 应 的 值 为 value， 则 删除 ， 如 果 删 除了 ， 返 回 true， 
// 和 否则 返回 false 
boolean remove(Object key, Object value ) 

// 条 件 替换 ， 如 果 Map 中 有 key， 且 对 应 的 值 为 0Ldvalue， 则 替换 为 newValue， 
// 如 果 替 换 了 ， 返 回 ture， 否 则 false 


boolean replace(K key, V oldValue, V newValue); 

// 条 件 蔡 换 ， 如 果 Map 中 有 key， 则 替换 值 为 value， 返 回 原来 key 对 应 的 值 ， 
// 如 果 原 来 没有 ， 返 回 nu11 

V replace(K key, V value); 


Java 8 增加 了 几 个 默认 方法 ， 包 括 getOrDefault、forEach、 
compnuteIfAbsent、merge 等 ， 具 体 可 参见 API 文 档 ， 我 们 吏 不 介绍 了 。 
如 果 使 用 同步 容 毁 ， 调 用 方 必 须 加 锁 ， 而 Concurrent-HashMap 将 它们 
实现 为 了 原子 操作 。 实 际 上 ， 使 用 ConcurrentHashMap， 调 用 方 也 没有 
办 法 进行 加 锁 ， 它 没有 骏 露 锁 接 口 ， 也 不 使 用 synchronized 。 


17.2.3 ”高 并 发 的 基本 机 制 


ConcurrentHashMap 是 为 高 并 发 设计 的 ， 它 是 怎么 做 的 呢 ? 具体 实 
现 比较 复杂 ， 我 们 简要 介绍 其 思路 ， 在 Java 7 中 ， 主 要 有 两 点 : 


分 段 锁 ; 
读 不 需要 锁 。 


同步 容 絮 使 用 synchronized， 所 有 方法 竞 搜 同一 个 锁 ; 而 
ConcurrentHashMap 采 用 分 段 锁 技 术 ， 将 数据 分 为 多 个 段 ， 而 每 个 段 有 
一 个 独立 的 锁 ， 每 一 个 段 相 当 于 一 个 独立 的 哈 硕 表 ， 分 段 的 依据 也 是 
哈 厦 值 ， 无 论 是 保存 键 值 对 还 是 根据 键 查找 ， 都 先 根据 键 的 哈 硕 值 映 
射 到 段 ， 再 在 段 对 应 的 哈 希 表 上 进行 操作 。 


采用 分 段 锁 ， 可 以 大 大 提高 并 发 度 ， 多 个 段 之 间 可 以 并 行 读 写 。 
默认 情况 下 ， 段 是 16 个 ， 不 过 ， 这 个 数字 可 以 通过 构造 方法 进行 设 
置 ， 如 下 所 示 : 


public ConcurrentHashMap(int initialCcapacity, 
float loadFactor, int concurrencyLevel) 


concurrencyLevel 表 示 估 计 的 并 行 更 狐 的 线程 个 数 ， 
ConcurrentHashMap 会 将 该 数 转换 为 2 的 整数 次 居 ， 比 如 14 转 换 为 16， 
25 转 换 为 32。 


在 对 每 个 段 的 数据 进行 读 写 时 ，ConcurrentHashMap 也 不 是 简单 地 
使 用 锁 进行 同步 ， 内 部 使 用 了 CAS。 对 一 些 写 采用 原子 方式 的 方法 ， 
实现 比较 复杂 ， 我 们 残 不 介绍 了 “。 实 现 的 效果 是 ， 对 于 写 操 作 ， 需 要 
获取 锁 ， 不 能 并 行 ， 但 是 读 操 作 可 以 ， 多 个 读 可 以 并 行 ， 写 的 同时 也 
可 以 读 ， 这 使 得 ConcurrentHashMap 的 并 行 度 远 高 于 同步 容 咽 。 


Java 8 对 ConcurrentHashMap 的 实现 进一步 做 了 优化 。 首 先 ， 与 
HashMap 的 改进 类 似 ， 在 哈 硕 冲突 比较 严重 的 时 候 ， 会 将 单 癌 链表 转 
化 为 平衡 的 排序 二 又 树 ， 提 高 查找 的 效率 ， 其 次 ， 锁 的 粒度 进一步 细 
化 了 ， 以 提高 并 行 性 ， 哈 希 表 数 组 中 的 每 个 位 置 (指向 一 个 单 链表 或 
树 ) 都 有 一 个 单独 的 锁 ， 具 体 比较 复杂 ， 我 们 就 不 介绍 了 。 
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我 们 在 15.2.3 节 介绍 过 ， 使 用 同步 容 希 ， 在 友 代 中 需要 加 锁 ， 否 则 
可 能 会 抛 出 Concurrent-ModificationException。ConcurrentHashMap 没 有 
这 个 问题 ， 在 迷 代 右 创 建 后 ， 在 大 代 过 程 中 ， 如 采 男 一 个 线程 对 容器 
进行 了 修改 ， 和 迭代 会 继续 ， 不 会 抛 出 异常 。 


问题 是 ， 和 迭代 会 反映 其 他 线程 的 修改 吗 ? 还 是 像 
CopyOnWriteArrayList 一 样 ， 反 映 的 是 创建 时 的 副本 ? 答案 是 ， 都 不 
是 ! 我 们 看 个 例子 ， 如 代码 清单 17-2 所 示 。 


代码 清单 17-2” ConcurrentHashMap 的 迭代 示例 


public class ConcurrentHashMapIteratorDemo { 
public static void test() { 
final ConcurrentHashMap<String, String> map = 
new ConcurrentHashMap<>(); 
map.put("a", "abstract"); 
map.put("b", "basic"); 
Thread t1 = new Thread() { 
QOverride 
public void run() 
for(Entry<String, String> entry : map.entrySet()) { 
try { 
Thread.sleep(1000); 


} catch (InterruptedException e) { 


System.out.printljn(entry.getkey() + "," + entry.getValue()); 
} 


} 
}; 
t1,Start()， 
// 确保 线程 t1 局 动 
try { 
Thread. sleep(100) 
} catch(InterruptedException e) { 


} 
map.put("c", "call"); 


public static void main(String[] args) { 
test(); 


t 局 动 后 ， 创 建 迭 代 器 ， 但 在 太 代 输出 每 个 元 素 前 ， 先 睡眠 1 秒 ， 
主线 程 启 动 tl 后 ， 先 睡眠 一 下 ， 确 你 t1 先 运行 ， 然 后 给 map 增 加 了 一 个 
元 素 ， 程 序 输出 为 : 


a,abstract 
b,basic 
c,call 


上 述 代 码 说 明 迭 代 万 反映 了 最 新 的 更 新 。 将 添加 语句 更 改 为 : 


map.put("g", "call"); 


会 发 现 程 序 输出 为 : 


a,abstract 
b,basic 


这 说 明 迭 代 絮 没有 反映 最 新 的 更 新 。 需 要 说 明 的 是 ， 这 是 Java 7 的 
输出 ，Java 8 和 Java 9 的 实现 不 太一 样 ， 输 出 也 不 太一 样 ， 但 也 有 相同 
0 ° 到 底 是 怎么 回 事 呢 ? 这 需要 我 们 理解 ConcurrentHashMap 的 弱 


17.2.5“” 弱 一 致 性 


ConcurrentHashMap 的 欠 代 恬 创 建 后 ， 吏 会 按照 哈 硕 表 结构 通 历 
个 元 素 ， 但 在 壳 历 过 程 中 ， 内 部 元 素 可 能 会 发 生变 化 ， 如 果 变 化 发 生 
在 已 乙 历 过 的 部 分 ， 送 代 絮 就 不 会 反映 出 来 ， 而 如 果 变 化 发 生 在 未 这 
历 过 的 部 分 ， 送 代 器 就 会 发 现 并 反映 出 来 ， 这 就 是 弱 一 任性 。 


类 似 的 情况 还 会 出 现在 ConcurrentHashMap 的 另 一 个 方法 : 


// 批 量 添 加 m 中 的 键 值 对 到 当前 Map 
public void putAll(Map<? extends K, ? extends V> m) 


该 方法 并 非 原子 操作 ， 而 是 调用 put 方 法 逐个 元 素 进 行 添 加 的 ， 在 
该 方法 没有 结束 的 时 候 ， 部 分 修改 效果 束 会 体现 出 来 。 


7 才 呈 


本 市 介绍 了 ConcurrentHashMap, 它 是 并 发 版 的 HashMap， 通 过 降 
低 锁 的 粒度 和 CAS 等 实现 了 高 并 发 ， 文 持原 子 条 件 更 新 操作 ， 不 会 抛 
出 ConcurrentModificationException， 实 现 了 弱 一 致 性 。 


Java 中 没有 并 发 版 的 HashSet， 但 可 以 通过 
Collections.newSetFromMap 方 法 基于 Con-currentHashMap 构 建 一 个 。 


我 们 知道 HashMap/HashSet 基 于 哈 希 ， 不 能 对 元 素 排 序 ， 对 应 的 可 
排序 的 容器 类 是 TreeMap/TreeSet， 并 发 包 中 可 排序 的 对 应 版 本 不 是 基 
于 树 ， 而 是 基于 Skip List (跳跃 表 )”， 类 分 别 是 
ConcurrentSkipListMap 和 ConcurrentSkipListSet， 它 们 到 底 是 什么 呢 ? 
让 我 们 下 市 讨论 。 


17.3 ”基于 跳 表 的 Map 和 Set 


Java 并 发 包 中 与 TreeMap/TreeSet 对 应 的 并 发 版 本 是 
ConcurrentSkipListMap 和 Concurrent-SkipListSet， 本 万 束 来 简要 探讨 这 
两 个 类 ， 先 介绍 基本 概念 ， 然 后 介绍 基本 实现 原理 。 


17.3.1 基本 概念 


我 们 知道 ，TreeSet 是 基于 TreeMap 实 现 的 ， 与 此 类 似 ， 
ConcurrentSkipListSet 也 是 基于 ConcurrentSkipListMap 实 现 的 ， 所 以 我 
们 主要 介绍 ConcurrentSkipListMap 。 


ConcurrentSkipListMap 是 基于 SkipList 实 现 的 ，SkipList 称 为 跳跃 表 
或 跳 表 ， 是 一 种 数据 结构 ， 稍 后 我 们 会 进一步 介绍 。 并 发 版 本 为 什么 
采用 跳 表 而 不 是 树 呢 ? 原因 也 很 简单 ， 因 为 跳 表 更 易于 实现 高 效 并 发 
算法 。ConcurrentSkipListMap 有 如 下 特点 。 


1) 没有 使 用 锁 ， 所 有 操作 都 是 无 阻塞 的 ， 所 有 操作 都 可 以 并 行 ， 
包括 写 ， 多 线程 可 以 同时 写 。 


2) 与 ConcurrentHashMap 类 似 ， 迭 代 器 不 会 抛 出 
ConcurrentModificationException， 是 弱 一 致 的 ， 迭 代 可 能 反映 最 新 修改 
也 可 能 不 反映 ， 一 些 方法 如 putAl1 、clear 不 是 原子 的 。 


3) 与 ConcurrentHashMap 类 似 ， 同 样 实现 了 ConcurrentMap 接 口 ， 
文 持 一 些 原子 复合 操作 。 


4) 与 TreeMap 一 样 ， 可 排序 ， 默 认 按 键 的 自然 顺序 ， 也 可 以 传递 
比较 器 和 目 定 义 排 序 ， 实 现 了 SortedMap 和 NavigableMap 接 口 。 


看 段 商 单 的 使 用 代码 : 


public static void main(String[] args) { 
Map<String, String> map = new ConcurrentSkipListMap<>( 
Collections.reverseOrder()); 
map.put("a", "abstract"); 
map.put("c", "call"); 


map.put("b", "basic"),; 
System.out.println(map.toSstring()); 
} 


程序 输出 为 : 


{c=call, b=basic, a=abstract} 


表示 十 有 序 的 。 


我 们 之 前 介绍 过 ConcurrentSkipListMap 的 大 部 分 方法 ， 有 序 的 方法 
与 TreeMap 是 类 似 的 ， 原 了 于 复合 操作 与 ConcurrentHashMap 是 类 似 的 ， 
此 处 不 再 警 述 。 


需要 说 明 的 是 ConcurrentSkipListMa 的 size 方法， 与 大 多 数 容 器 实现 
不 同 ， 这 个 方法 不 是 常量 操作 ， 它 需要 遍历 所 有 元 素 ， 复 杂 度 为 O 

(N) ， 而 且 遍 历 结束 后 ， 元 素 个 数 可 能 已 经 变 了 。 一 般 而 言 ， 在 并 发 
应 用 中 ， 这 个 方法 用 处 不 大 。 下 面 我 们 主要 介绍 其 基本 实现 原理 。 


17.3.2 ”基本 实现 原理 

我 们 先 来 介绍 跳 表 的 结构 ， 跳 表 是 基于 链表 的 ， 在 链表 的 基础 上 
2 。 我 们 通过 一 个 简单 的 例子 来 说 明 。 假 定 容 器 中 包 
含 如 下 元 素 : 


3, 6, 7, 9, 12, 17, 19, 21, 25, 26 


对 Map 来 说 ， 这 些 值 可 以 视 为 键 。ConcurrentSkipListMap 会 构造 类 
似 图 17-1 所 示 的 跳 表 结构 。 


图 17-1” 跳 表 结 构 示 例 
最 下 面 一 层 就 是 最 基本 的 单 向 链表 ， 这 个 链表 是 有 序 的 。 虽 然 是 


有 序 的 ， 但 我 们 知道 ， 与 数组 不 同 ， 链 表 不 能 根据 索引 直接 定位 ， 不 


能 进行 二 分 查找 。 


为 了 快速 查找 ， 跳 表 有 多 层 索 引 结 构 ， 这 个 例子 中 有 两 层 ， 第 一 
层 有 5 个 节点 ， 第 二 层 有 2 个 节点 。 高 层 的 索引 市 点 一 定 同 时 是 低层 的 
索引 点 ， 比如 9 和 21。 高 层 的 索引 节点 少 ， 低 层 的 多 。 统 计 概率 上 ， 
第 一 层 索 引 节 点 是 实际 元 素数 的 2， 第 二 层 是 第 一 层 的 112， 逐 层 减 
半 ， 但 这 不 是 绝对 的 ， 有 随机 性 ， 只 是 大 致 如 此 。 每 个 索引 和 点 有 两 
个 指针 : 一 个 辐 右 ， 指 向 下 一 个 同 层 的 索引 和 点 ; 另 一 个 和 同 下 ， 指 同 
下 一 层 的 索引 节点 或 基本 链表 节点 。 


有 了 这 个 结构 ， 就 可 以 实现 类 似 二 分 查找 了 。 查找 元 素 总 是 从 最 
高 层 开始 ， 将 待 查 值 与 下 一 个 索引 市 点 的 值 进 行 比较 ， 如 果 大 于 索引 
节点 ， 就 辣 右 移动 ， 继 续 比 较 ， 如 果 小 于 索引 方 点 ， 则 癌 下 移动 到 下 
一 层 进行 比较 。 图 17-2 所 示 的 两 条 线 展 示 了 查找 值 19 和 8 的 过 程 。 


图 17-2 在 跳 表 中 但 找 的 示例 


对 于 值 19， 查 找 过 程 是 : 

1) 与 9 相 比 ， 大 于 9; 

向 右 与 21 相 比 ， 小 于 21; 
向 下 与 17 相 比 ， 大 于 17; 
4) 向 右 与 21 相 比 ， 小 于 21; 
5) 向 下 与 19 相 比 ， 找 到 。 
对 于 值 8， 查 找 过 程 是 : 

) 与 9 相 比 ， 小 于 9; 

) 向 下 与 6 相 比 ， 大 于 6; 
3) 向 右 与 9 相 比 ， 小 于 9; 
) 
) 


CD 


) 
) 
) 
) 


回 下 与 7 相 比 ， 大 于 7; 
回 右 与 9 相 比 ， 小 于 9， 不 能 再 向 下 ， 没 找到 。 

这 个 结构 是 有 序 的 ， 查 找 的 性 能 与 二 叉 树 类 似 ， 复 杂 度 是 O (log 
(N) ) 。 不 过 ， 这 个 结构 是 如 何 构建 起 来 的 呢 ? 与 二 义 树 类 似 ， 这 个 
结构 是 在 更 新 过 程 中 进行 保持 的 ， 保 存 元 素 的 基本 思路 是 : 


0 


链 


2) 更 新 索引 层 。 


对 于 索引 更 新 ， 随 机 计算 一 个 数 ， 表 示 为 该 元 素 最 高 建 儿 层 索 
引 ， 一 层 的 概率 为 2， 二 层 的 概率 为 4， 三 层 的 概率 为 118， 以 此 类 
推 。 然 后 从 最 高 层 到 最 低层 ， 在 每 一 层 ， 为 该 元 素 建立 索引 节点 ， 建 
立 索 引 节 点 的 过 程 也 是 先 查 找 位 置 ， 再 插入 。 


对 于 删除 元 素 ，ConcurrentSkipListMap 不 是 直接 进行 真正 删除 ， 而 
是 为 了 避免 并 发 冲突 ， 有 一 个 复杂 的 标记 过 程 ， 在 内 部 遇 历 元 素 的 过 


程 中 进行 真正 删除 。 


以 上 我 们 只 是 介绍 了 基本 思路 ， 为 了 实现 并 发 安 人 全、 高效、 无 锁 
非 阻 奢 ，Concurrent-SkipListMap 的 实现 非常 复杂 ， 有 具体 我 们 束 不 探讨 
了 ， 感 兴趣 的 读者 可 以 参考 其 源码 ， 其 中 提 到 了 多 篇 学 术 论 文 ， 论 文 
中 摘 述 了 它 参 考 的 一 些 算法 。 对 于 第 见 的 操作 ， 如 
人 containsSKey，ConcurrentSkipListMap 的 复杂 度 都 是 O 
log AN 


上 面 介 绍 的 SkipList 结 构 是 为 了 便于 并 发 操作 的 ， 如 采 不 需要 并 
发 ， 可 以 使 用 另 一 种 更 为 高 效 的 结构 ， 数 据 和 所 有 层 的 索引 放 到 一 个 
斑 氮 中， 如 网 17-3 所 示 。 


head 


图 17-3 ”数据 和 索引 都 在 一 个 节点 中 的 跳 表 


对 于 一 个 元 素 ， 只 有 一 个 节点 ， 只 是 每 个 节点 的 索引 个 数 可 能 不 
， 在 新 建 一 个 节点 时 ， 使 用 随机 算法 决定 它 的 索引 个 数 。 平 均 而 
，1/2 的 元 素 有 两 个 索引 ，1/4 的 元 素 有 三 个 索引 ， 以 此 类 推 。 


人 简单 总 结 下 ，ConcurrentSkipListMap 和 ConcurrentSkipListSet 基 于 
We 
N O 


HI -到 


17.4 并 发 队列 


本 方 ， 我 们 介绍 Java 并 发 包 中 的 各 种 队列 。Java 并 发 包 提供 了 让 
富 的 队列 类 ， 可 以 简单 分 为 以 下 几 种 。 


.无 饥 非 阻塞 并 发 队列 :ConcurrentLinkedQueue 和 


ConcurrentLinkedDeque。 


.普通 阻塞 队列 : 基于 数组 的 ArrayBlockingQueue， 基 于 链表 的 
LinkedBlockingQueue 和 LinkedBlockingDeque。 


.优先 级 阻塞 队列 :PriorityBlockingQueue 。 
. 延 时 了 间 塞 队列 :DelayQueue。 
.其 他 阻 土 队 列 :， SynchronousQueue 和 LinkedTransferQueue 。 


无 锁 非 阻塞 是 指 ， 这 些 队列 不 使 用 锁 ， 所 有 操作 总 是 可 以 立即 执 
行 ， 主 要 通过 循环 CAS 实 现 并 发 安全 。 阻 塞 队 列 是 指 ， 这 些 队 列 使 用 
贫 和 条 件 ， 很 多 操作 都 需要 先 获 取 锁 或 满足 特定 条 件 ， 获 取 不 到 锁 或 
等 待 条 件 时 ， 会 等 待 ( 即 阻塞 ) ， 获 取 到 锁 或 条 件 满足 再 返回 。 


这 些 队 列 迭 代 都 不 会 抛 出 ConcurrentModificationException， 都 是 
弱 一 致 的 ， 后 面 惑 不 单独 强调 了 。 下 面 ， 我 们 来 简要 介绍 每 类 队列 的 
用 途 、 用 法 和 基本 实现 原理 。 


17.4.1 无 锁 非 阻 短 并 发 队列 


有 两 个 无 锁 非 阻塞 队列 : ConcurrentLinkedQueue 和 
ConcurrentLinkedDeque， 它 们 适用 于 多 个 线程 并 发 使 用 一 个 队列 的 场 
合 ， 都 是 基于 链表 实现 的 ， 都 没有 限制 大 小 ， 是 无 界 的， 与 
ConcurrentSkipListMap 类 似 ， 它 们 的 size 方 法 不 是 一 个 常量 运算 ， 不 过 
这 个 方法 在 并 发 应 用 中 用 处 也 不 大 。 


ConcurrentLinkedQueue 实 现 了 Queue 接 口 ， 表 示 一 个 先进 先 出 的 
队列 ， 从 尾部 入 队 ， 从 头 部 出 队 ， 内 部 是 一 个 单 回 链 表 。 
ConcurrentLinkedDeque 实 现 了 Deque 接 口 ， 表 示 一 个 双 端 队列 ， 在 两 
问 都 可 以 入 队 和 出 队 ， 内 部 是 一 个 双 回 链表。 它们 的 用 法 类 似 于 
Linked-List， 我 们 就 不 袭 述 了 。 


这 两 个 类 最 基础 的 原理 是 循环 CAS，ConcurrentLinkedQueue 的 算 
法 基于 一 篇 论文 《Simple，Fast，and Practical Non-Blocking and 
Blocking Concurrent Queue Algorithm》 
(https://www.research.ibm.com/people/m/michael/podc-1996.pdf ) 。 
ConcurrentLinkedDeque 扩 展 了 Con-currentLinkedQueue 的 技术 ， 但 它们 
的 具体 实现 都 非常 复杂 ， 我 们 残 不 探讨 了 。 


17.4.2 ”普通 阻塞 队列 


除了 刚 介 绍 的 两 个 队列 ， 其 他 队列 都 是 阻塞 队列 ， 都 实现 了 接口 
BlockingQueue， 在 入 队 /出 队 时 可 能 等 待 ， 主 要 方法 有 : 


// 入 队 ， 如 果 队列 满 ， 等 待 直到 队列 有 空间 

void put(E e) throws InterruptedException; 

// 出 队 ， 如 果 队列 空 ， 等 待 直到 队列 不 为 空 ， 返 回头 部 元 素 

E take() throws InterruptedException; 

// 入 队 ， 如 果 队 列 满 ， 最 多 等 待 指定 的 上 时间， 如 果 超 时 还 是 满 ， 返 回 false 

boolean offer(E e, long timeout, TimeUnit unit) throws InterruptedException,; 
// 出 队 ， 如 果 队 列 空 ， 最 多 等 待 指定 的 时 间 ， 如 果 超 时 还 是 空 ， 返 回 null 

E poll(long timeout, TimeUnit unit) throws InterruptedException,; 


普通 阻塞 队列 是 各 用 的 队列 ， 和 党 用 于 生产 者 /消费 者 模式 。 


ArrayBlockingQueue 和 LinkedBlockingQueue 都 实现 了 Queue 接 口 ， 
表示 先进 移出 的 队列 ， 尾 部 进 ， 头 部 出 ， 而 LinkedBlockingDeque 实 现 
了 Deque 接 口 ， 是 一 个 双 端 队列 。 


ArrayBlockingQueue 是 基于 循环 数组 实现 的 ， 有 界 ， 创 建 时 需要 
指定 大 小 ， 且 在 运行 过 程 中 不 会 改变 ， 这 与 我 们 在 容 絮 类 中 介绍 的 
ArrayDeque 是 不 同 的 ，ArrayDeque 也 是 基于 循环 数组 实现 的 ， 但 是 是 
无 界 的 ， 会 目 动 扩展 。 


LinkedBlockingQueue 是 基于 单 癌 链表 实现 的 ， 在 创建 时 可 以 指定 
最 大 长 度 ， 也 可 以 不 指定 ， 默 认 是 无 限 的 ， 节 点 都 是 动态 创建 的 。 
LinkedBlockingDeque 与 LinkedBlocking-Queue 一 样 ， 最 大 长 度 也 是 在 
创建 时 可 选 的 ， 默 认 无 限 ， 不 过 ， 它 是 基于 双 回 链表 实现 的 。 


内 部 ， 它 们 都 是 使 用 显 式 锁 ReentrantLock 和 显 式 条 件 Condition 实 
现 的 。 


ArrayBlockingQueue 的 实现 很 直接 ， 有 一 个 数组 存储 元 素 ， 有 两 
个 索引 表示 头 和 尾 ， 有 一 个 变量 表示 当前 元 素 个 数 ， 有 一 个 锁 保 护 所 
有 访问 ， 有 “不 满 ? 和 “不 空 ? 两 个 条 件 用 于 协作 ， 实 现 思 路 与 我 们 在 
15.3.3 玫 实现 的 类 似 ， 残 不 性 述 了 。 


与 ArrayBlockingQueue 类 似 ，LinkedBlockingDeque 也 是 使 用 一 个 
锁 和 两 个 条 件 ， 使 用 锁 保 扩 所 有 操作 ， 使 用 “不 满 *? 和 “不 空 ”两 个 条 
件 。LinkedBlockingQueue 稍 微 不 同 ， 因 为 它 使 用 链表 ， 且 只 从 头 部 出 
队 、 从 尾部 入 队 ， 它 做 了 一 些 优 化 ， 使 用 了 两 个 锁 ， 一 个 保护 头 部 ， 
一 个 傈 护 尾 部 ， 每 个 锁 关 联 一 个 条 件 。 


17.4.3 ”优先 级 阻塞 队列 


普通 阻塞 队列 是 先进 移出 的 ， 而 优先 级 队列 是 按 优先 级 出 队 的 ， 
优先 级 高 的 先 出 ， 我 们 在 容器 类 中 介绍 过 优先 级 队列 PriorityQueue 及 
其 背后 的 数据 结构 堆 。Priority-BlockingQueue 是 PriorityQueue 的 并 发 版 
本 ， 与 PriorityQueue 一 样 ， 它 没有 大 小 限制 ， 是 无 界 的 ， 内 部 的 数组 
大 小 会 动态 扩展 ， 要 求 元 素 要 么 实现 Comparable 接 口 ， 要 么 创建 
Priority-BlockingQueue 时 提供 一 个 Comparator 对 象 。 


与 PriorityQueue 的 区 别 是 ，PriorityBlockingQueue 实 现 了 
BlockingQueue 接 口 ， 在 队列 为 空 时 ，take 方 法 会 阻塞 等 待 。 吃 外 ， 
PriorityBlockingQueue 是 线程 安全 的 ， 它 的 基本 实现 原理 与 
PriorityQueue 是 一 样 的 ， 也 是 基于 堆 ， 但 它 使 用 了 一 个 锁 
ReentrantLock 保 护 所 有 访问 ， 使 用 了 一 个 条 件 协调 阻塞 等 待 。 


17.4.4” 延 时 阻塞 队列 


延 时 阻塞 队列 DelayQueue 是 一 种 特殊 的 优先 级 队列 ， 它 是 无 界 
的 。 它 要 求 每 个 元 素 都 实现 Delayed 接 口 ， 该 接口 的 声明 为 : 


public interface Delayed extends Comparable<Delayed> { 
long getDelay(TimeUnit unit); 


Delayed 扩 展 了 Comparable 授 口 ， 也 就 是 说 ，DelayQueue 的 每 个 元 
素 都 是 可 比较 的 ， 它 有 一 个 额外 方法 getDelay 返 回 一 个 给 定时 间 单 位 
unit 的 整数 ， 表 示 再 延迟 多 长 时 间 ， 如 采 小 于 等 于 0， 则 表示 不 再 延 


识 。 


DelayQueue 可 以 用 于 实现 定时 任务 ， 它 按 元 素 的 延 时 时 间 出 队 。 
它 的 特殊 之 处 在 于 ， 只 有 当 元 素 的 延 时 过 期 之 后 才能 被 从 队列 中 拿 
人 
塞 等 待 。 


DelayQueue 是 基于 PriorityQueue 实 现 的 ， 它 使 用 一 个 锁 
ReentrantLock 保 护 所 有 访问 ， 使 用 一 个 条 件 available 表 示 头 部 是 否 有 
元 素 ， 当 头 部 元 素 的 延 时 未 到 时 ，take 操 作 会 根据 延 时 计算 需 睡 眠 的 
时 间 ， 然 后 睡眠 ， 如 果 在 此 过 程 中 有 新 的 元 素 入 队 ， 且 成 为 头 部 元 
素 ， 则 阻 突 睡眠 的 线程 会 被 提前 唤醒 然 后 重新 检查 。 这 是 基本 思路 ， 
1 以 减少 不 必要 的 唤醒 ， 有 具体 我 们 残 不 
宁 人 于 。 


17.4.5 ”其 他 阻塞 队列 


Java 并 发 包 中 还 有 两 个 特殊 的 阻塞 队列 : SynchronousQueue 和 


LinkedTransferQueue ° 


SynchronousQueue 与 一 般 的 队列 不 同 ， 它 不 算 一 种 真正 的 队列 ， 
没有 存储 元 素 的 空间 ， 连 存储 一 个 元 素 的 空间 都 没有 。 它 的 入 队 控 作 
要 等 待 另 一 个 线程 的 出 队 操作 ， 反 之 亦 然 。 如 果 没 有 其 他 线程 在 等 竺 
从 队列 中 接收 元 素 ，put 操 作 束 会 等 得 。take 操 作 需 要 等 每 其 他 线程 往 
队列 中 放 元 素 ， 如 果 没 有 ， 也 会 等 待 。SynchronousQueue 适 用 于 两 个 
线程 之 间 直 接 传 递 信息 、 事 件 或 任务 。 


LinkedTransferQueue 实 现 了 TransferQueue 接 口 ，TransferQueue 是 
BlockingQueue 的 子 接口 ， 但 增加 了 一 些 额 外 功能 ， 生 产 者 在 往 队 列 中 
放 元 素 时 ， 可 以 等 待 消费 者 接收 后 再 返回 ， 适 用 于 一 些 消息 传递 类 型 
的 应 用 中 。TransferQueue 的 接口 定义 为 : 


public interface TransferQueue<E> extends BlockingQueue<E> { 
// 如 果 有 消费 者 在 等 待 (执行 take 或 限时 的 p011)， 接 转 给 消费 者 ， 
// 返 回 true， 否 则 返回 false, 不 入 队 
boolean tryTransfer(E e); 
// 如 果 有 消费 者 在 等 待 ， 直 接 转 给 消费 者 ， 否 则 入 队 ， 阻 塞 等 待 直到 被 消费 者 接收 后 再 返 世 
void transfer(E e) throws InterruptedException,; 
// 如 果 有 消费 者 在 等 待 ， 直 接 转 给 消费 者 ， 返 回 true 
/否则 入 队 ， 阻塞 等 待 限定 的 时 间 ， 如 果 最 后 被 消费 者 接收 ， 返 回 true 
boolean tryTransfer(E e, long timeout, TimeUnit unit) 

throws InterruptedException; 

// 是 否 有 消费 者 在 等 待 
boolean haswaitingConsumer(); 
// 等 待 的 消费 者 个 数 
int getwaitingConsumerCount(); 


LinkedTransferQueue 是 基于 链表 实现 的 、 无 界 的 TransferQueue， 
具体 实现 比较 复杂 ， 我 们 就 不 探讨 了 。 


关于 Java 并 发 包 的 各 种 容器 ， 至 此 就 介绍 完了 ， 在 实际 开发 中 ， 
应 该 尽量 使 用 这 些 现 成 的 容器 ， 而 非 “重新 发 明 轮 子 "。 


Java 并 发 包 中 还 提供 了 一 种 万 便 的 任务 执 f J 了 服务， 使 用 它 ， 可 以 
将 要 执行 的 并 发 任务 与 线程 的 管理 相 分 离 ， 大 大 简化 并 发 任务 和 线程 
的 管理 ， 让 我 们 下 一 章 来 探讨 。 


第 18 章 ”异步 任务 执行 服务 


在 之 前 的 介绍 中 ， 线 程 Thread 既 表示 要 执行 的 任务 ， 又 表示 执行 
的 机 制 。Java 并 发 包 提供 了 一 套 框 架 ， 大 大 们 化 了 执行 异步 任务 所 需 
的 开发 。 这 套 框 架 引 入 了 一 个 “执行 服务 ”的 概念 ， 它 将 “任务 的 提 
交 ?” 和 "任务 的 执行 ? 相 分 离 , “执行 服务 ?封装 了 任务 执行 的 细 开 ， 对 于 
任务 提交 者 而 言 ， 它 可 以 关注 于 任务 本 映 ， 如 提交 任务 、 获 取 结 果 、 
取 请 任务 ， 而 不 需要 关注 任务 执行 的 细节 ， 如 线程 创建 、 任 务 调 度 、 
线程 关闭 等 。 

本 章 我 们 束 来 探讨 这 套 框 杂 ， 有 具体 分 为 3 个 小 节 : 18.1 介 绍 基本 
概念 和 原理 ;18.2 节 介绍 任务 执行 服务 的 主要 实现 机 制 : 线程 池 ;， 18.3 
世 介 绍 定时 任务 的 执行 服务 。 


18.1 基本 概念 和 原理 


下 面 ， 我 们 来 看 异步 任务 执行 服务 的 基本 接口 、 用 法 和 实现 原 


理 
18.1.1 基本 接口 


首先 ， 我 们 来 看 任务 执行 服务 涉及 的 基本 接口 : 


.Runnable 和 Callable: 表示 要 执行 的 异步 任务 。 


:Executor 和 ExecutorService: 表示 执行 服务 。 
Future: 表示 异步 任务 的 结果 。 
关于 Runnable 和 Callable， 我 们 在 前 面 草 节 都 已 经 了 解 了 ， 都 表示 


任务 ，Runnable 没 有 返回 结果 ， 而 Callable 有 ，Runnable 不 会 抛 出 异 
常 ， 而 Callable 会 。 


Executor 表 示 最 简单 的 执行 服务 . 其 定义 为 : 


public interface Executor { 
void execute(Runnable command); 


} 


就 是 可 以 执行 一 个 Runnable， 没 有 返回 结果 。 接 口 没 有 限定 任务 
如 何 执行 ， 可 能 是 创建 一 个 新 线程 ， 可 能 是 复 用 线程 池 中 的 某 个 线 
程 ， 也 可 能 是 在 调用 者 线程 中 执行 。 


ExecutorService 扩 展 了 Executor， 定 义 了 更 多 服务 ， 基 本 方法 有 : 


public interface ExecutorService extends Executor { 
<T> Future<T> submit(Callable<T> task),; 
<T> Future<T> submit(Runnable task, T result); 
Future<?> submit(Runnable task); 
//..， 其 他 方法 

} 


这 三 个 submit 都 表示 提交 一 个 任务 ， 返 回 值 类 型 都 是 Future， 返 回 
后 ， 只 是 表示 任务 已 提交 ， 不 代表 已 执行 ， 通 过 Future 可 以 查询 异步 
任务 的 状态 、 获 取 最 终结 果 、 取 消 任务 等 。 我 们 知道 ， 对 于 Callable， 
任务 最 终 有 个 返回 值 ， 而 对 于 Runnable 是 没有 返回 值 的 ， 第 二 个 提交 
Runnable 的 方法 可 以 同时 提供 一 个 结果 ， 在 异步 任务 结束 时 返回 ; 第 
三 个 方法 异步 任务 的 最 终 返 回 值 为 null 。 


我 们 来 看 Future 接 口 的 定义 : 


public interface Future<V> 
boolean cancel(boolean mayInterruptIfRunning ) ， 
boolean isCancelled(); 
boolean isDone(); 
V get() throws InterruptedException, ExecutionException,; 
V get(long timeout, TimeUnit unit) throws InterruptedException, 
ExecutionException, TimeoutException; 


get 用 于 返回 异步 任务 最 终 的 结果 ， 如 果 任 务 还 未 执行 完成 ， 会 阻 
塞 等 待 ， 另 一 个 get 方 法 可 以 限定 阻塞 等 竺 的 时 间 ， 如 果 超 时 任务 还 未 
结束 ， 会 抛 出 TimeoutException。 


cancel 用 于 取消 异步 任务 ， 如 果 任 务 已 完成 、 或 已 经 取消 、 或 由 
于 某 种 原因 不 能 取消 ，cancel 返 回 false， 否 则 返回 true。 如 果 任 务 还 未 
开始 ， 则 不 再 运行 。 但 如 果 任 务 已 经 在 运行 ， 则 不 一 定 能 取消 ， 参 数 
mayInterruptIfRunning 表 示 ， 如 采 任 务 正在 执行 ， 是 否 调 用 interrupt 方 
法 中 断 线程 ， 如 有 果 为 false 束 不 会 ， 如 果 为 tue， 束 会 符 试 中 断 线程 ， 但 
我 们 从 15.4 慷 知道， 中断 不 一 定 能 取消 线程 。 


isDone 和 isCancelled 用 于 查询 任务 状态 。isCancelled 表 示 任 务 是 否 
被 取消 ， 只 要 cancel] 方 法 返回 了 true， 随 后 的 isCancelled 方 法 都 会 返回 
true， 即 使 执行 任务 的 线程 还 未 真正 结束 。isDone 表 示 任 务 是 否 结束 ， 
不 管 什 么 原因 都 算 ， 可 能 是 任务 正常 结束 ， 可 能 是 任务 扫 出 了 异常 ， 
也 可 能 是 任务 被 取消 。 


我 们 再 来 看 下 get 方 法 ， 任 务 最 终 大 概 有 三 种 结果 : 


1) 正常 完成 ，get 方 法 会 返回 其 执行 结果 ， 如 果 任 务 是 Runnable 
且 没 有 提供 结果 ， 返 回 null。 


2) 任务 执行 扫 出 了 异常 ，get 方 法 会 将 异常 包装 为 
ExecutionException 重 新 抛 出 ， 通 过 异常 的 getCause 方 法 可 以 获取 原 异 


吊 心 
3) 任务 被 取消 了 ，get 方 法 会 抛 出 异常 CancellationException 。 
如 有 果 调 用 get 方 法 的 线程 被 中 断 了 ，get 方 法 会 抛 出 


InterruptedE.xception ° 


ee E 现 “ 任 务 的 提交 ”与 “任务 的 执行 ” 相 
分 离 的 关键 ,是 其 中 的 “纽带 ”， 信和 提 区 各 和 任 名 册 汪 服务 加 过 它 隔 
离 各 目的 关注 点 ， ， 同 时 进行 协作 。 


18.1.2 ”基本 用 法 


说 了 这 么 多 接口 ， 具 体 怎 么 用 呢 ? 我 们 看 个 简单 的 例子 ， 如 代码 
清单 18-1 所 示 。 


代码 清单 18-1 任务 执行 服务 的 基本 示例 


public class BasicDemo { 
static class Task implements Callable<Integer> { 
QOverride 
public Integer call() throws Exception 区 
int sleepSeconds = new Random().nextInt(1000); 
Thread.sleep(sleepSeconds); 
return SleepSeconds ; 


} 


public static void main(String[] args) throws InterruptedException { 
ExecutorService executor = Executors.newSingleThreadExecutor(); 
Future<Integer> future = executor.submit(new Task()); 
// 模 拟 执行 其 他 任务 
Thread. sleep(100) 
try { 
System,.out ,println(future.get())， 
} catch (ExecutionException e) { 
e.printStackTrace( ); 


executor .shutdown( ) ; 


我 们 使 用 工厂 类 Executors 创 建 了 一 个 任务 执行 服务 。Executors 有 
多 个 静态 方法 ， 可 以 用 来 创建 ExecutorService， 这 里 使 用 的 是 : 


public static ExecutorService newSingleThreadExecutor() 


表示 使 用 一 个 线程 执行 所 有 服务 ， 后 续 我 们 会 详细 介绍 
Executors， 注 意 与 Executor 相 区 别 ， 后 者 是 单数 ， 是 接口 。 


不 管 ExecutorService 是 如 何 创建 的 ， 对 使 用 者 而 言 ， 用 法 都 一 
样 ， 例 子 提交 了 一 个 任务 ， 提 区 后 ， 可 以 继续 执行 其 他 事情 ， 随 后 可 
以 通过 Future 获 取 最 终结 果 或 处 理 任务 执行 的 异常 。 


最 后 ， 我 们 调用 了 ExecutorService 的 shutdown 方 法 ， 它 会 天 闭 任务 
执行 服务 。 


前 面 我 们 只 是 介绍 了 ExecutorService 的 三 个 submit 方 法 ， 其 实 它 还 
有 如 下 方法 : 


public interface ExecutorService extends Executor { 
void shutdown(); 
List<Runnable> shutdownNow( ) ， 
boolean isShutdown(); 
boolean isTerminated(); 
boolean awaitTermination(long timeout, TimeUnit unit) 
throws InterruptedException; 
<T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks) 
throws InterruptedException; 
<T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks, 
long timeout, TimeUnit unit) 
throws InterruptedException; 
<T> T invokeAny(Collection<? extends Callable<T>> tasks) 
throws InterruptedException, ExecutionException,; 
<T> T invokeAny(Collection<? extends Callable<T>> tasks, 
long timeout, TimeUnit unit) 
throws InterruptedException, ExecutionException, TimeoutException; 


有 两 个 关闭 方法 : shutdown 和 shutdownNow。 区别 是 ，shutdown 
表示 不 再 接受 新 任务 ， 但 已 提交 的 任务 会 继续 执行 ， 即 使 任务 还 未 开 
始 执行 ;shutdownNow 不 仅 不 接受 新 任务 ， 而 且 会 终止 已 提交 但 尚未 
执行 的 任务 ， 对 于 正在 执行 的 任务 ， 一 般 会 调用 线程 的 interrupt 方 法 答 
试 中 断 ， 不 过 ， 线 程 可 能 不 啊 应 中 断 ，shutdownNow 会 返回 已 提交 但 
尚未 执行 的 任务 列表 。 


shutdown 和 shutdownNow 不 会 阻塞 等 待 ， 它 们 返回 后 不 代表 所 有 
任务 都 已 结束 ， 不 过 isShutdown 方 法 会 返回 true。 调 用 者 可 以 通过 
awaitTermination 等 待 所 有 任务 结束 ， 它 可 以 限定 等 待 的 时 间 ， 如 果 超 
时 前 所 有 任务 都 结束 了 ， 即 isTerminated 方 法 返回 true， 则 返回 true， 否 
则 返回 false 。 


ExecutorService 有 两 组 批量 提交 任务 的 方法 : invokeAl 和 
invokeAny， 它 们 都 有 两 个 版 本 ， 其 中 一 个 限定 等 待 时 间 。 


invokeAll 等 待 所 有 任务 完成 ， 返 回 的 Future 列 表 中 ， 每 个 Future 的 
isDone 方 法 都 返回 true， 不 过 isDone 为 true 不 代表 任务 就 执行 成 功 了 ， 
可 能 是 被 取消 了 。invokeAl 可 以 指定 等 待 时间 ， 如 果 超 时 后 有 的 任务 
没完 成 ， 就 会 被 取消 。 


而 对 于 invokeAny， 只 要 有 一 个 任务 在 限时 内 成 功 返 回 了 ， 它 就 会 
返回 该 任务 的 结 采 ， 其 他 任务 会 被 取消 ; 如 有 果 没 有 任务 能 在 限时 内 成 
功 返 回 ， 抛 出 TimeoutException; 如 果 限 时 内 所 有 任务 都 结束 了 ， 但 都 
发 生 了 异常 ， 抛 出 ExecutionException 。 


使 用 ExecutorService， 编 写 并 发 异步 任务 的 代码 就 像 写 顺序 程序 
一 样 ， 不 用 关心 线程 的 创建 和 协调 ， 只 需要 提交 任务 、 人 处 理 结果 就 可 
以 了 ， 大 大 简化 了 开发 工作 。 


18.1.3 ”基本 实现 原理 


了 解 了 ExecutorService 和 Future 的 基本 用 法 ， 我 们 来 看 下 它们 的 基 
本 实现 原理 。 


ExecutorService 的 主要 实现 类 是 ThreadPoolExecutor， 它 是 基于 线 
程 池 实 现 的 ， 关 于 线程 池 我 们 下 和 再 介绍 。ExecutorService 有 一 个 抽 
象 实现 类 AbstractExecutorService， 本 世 ， 我 们 位 要 分 析 其 原理 ， 并 基 
于 它 实 现 一 个 简单 的 ExecutorService。Future 的 主要 实现 类 是 
FutureTask， 我 们 也 会 位 要 探讨 其 原理 。 


1.AbstractExecutorService 


AbstractExecutorService 提 供 了 submit、invokeAll 和 invokeAny 的 默 
认 实 现 ， 子 类 需要 实现 其 他 方法 。 除 了 execute， 其 他 方法 都 与 执行 服 
务 的 生命 周期 管理 有 关 ， 简 化 起 见 ， 我 们 忽略 其 实现 ， 主 要 考虑 
execute。SsubmitUinvokeAllyinvokeAny 最 终 都 会 调用 execute，execute 决 
定 了 到 底 如 何 执行 任务 ， 简 化 起 见 ， 我 们 为 每 个 任务 创建 一 个 线程 。 
一 个 完整 的 最 简单 的 ExecutorService 实 现 类 如 代码 清单 18-2 所 示 。 


代码 清单 18-2 一 个 简单 的 ExecutorService 实 现 类 


public class SimpleExecutorService extends AbstractExecutorService { 
QOverride 
public void shutdown() { 
} 


QOverride 
public List<Runnable> shutdownNow() { 
return null; 


QOverride 
public boolean isShutdown() { 
return false,; 


QOverride 
public boolean isTerminated() { 
return false,; 


QOverride 
public boolean awaitTermination(long timeout, TimeUnit unit) 
throws InterruptedException { 
return false,; 
QOverride 


public void execute(Runnable command) { 
new Thread(command).start(); 


对 于 前 面 的 例子 ， 创 建 ExecutorService 的 代码 可 以 蔡 换 为 : 


ExecutorService executor = new SimpleExecutorService(); 


可 以 实现 相同 的 效果 。 


ExecutorService 最 基本 的 方法 是 submit， 它 是 如 何 实现 的 呢 ? 我 们 
来 看 AbstractExecutor-Service 的 代码 (基于 Java 7) 


public <T> Future<T> submit(Callable<T> task) { 
if(task == null) throw new NullPointerException(); 
RunnableFuture<T> ftask = newTaskFor(task); 
execute(ftask); 
return ftask,; 


它 调 用 newTaskFor 生 成 了 一 个 RunnableFuture，RunnableFuture 是 
一 个 接口 ， 既 扩展 了 Runnable， 又 扩展 了 Future， 没 有 定义 新 方法 ， 作 
为 Runnable， 它 表示 要 执行 的 任务 ， 传 递 给 execute 方 法 进行 执行 ， 作 
为 Future， 它 又 表示 任务 执行 的 异步 结果 。 这 可 能 令 人 混淆 ， 我 们 来 
看 具体 代码 : 


protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable) { 
return new FutureTask<T>(callable); 


束 是 创建 了 一 个 FutureTask 对 象 ，FutureTask 实 现 了 RunnableFuture 
接口 。 它 是 怎么 实现 的 呢 ? 我 们 接 下 来 看 (基于 Java 7) 。 


2.FutureTask 


它 有 一 个 成 员 变 量 表示 答 执 行 的 任务 ， 声 明 为 : 


private Callable<V> callable; 


有 个 整数 变量 state 表 示 状 态 ， 声 明 为 : 


private volatile int state,; 


取 值 可 能 大 


NEW = 0; // 刚 开始 的 状态 ， 或 任务 在 运行 
COMPLETING ”= 1 // 临 时 状态 ， 任 务 即 将 结束 ， 在 设置 结果 
NORMAL = 2; // 任 务 正常 执行 完成 

EXCEPTIONAL = 3; // 任 务 执行 抛 出 异常 结束 

CANCELLED = 4; // 任 务 被 取消 

INTERRUPTING = 5; // 任 务 在 被 中 断 

INTERRUPTED ”= 6; // 任 务 被 中 断 


有 个 变量 表示 最 终 的 执行 结果 或 异 币 ， 声 明 为 : 


private Object outcome 


有 个 变量 表示 运行 任务 的 线程 : 


private volatile Thread runner ， 


还 有 个 单 癌 链表 表示 等 待 任务 执行 结果 的 线程 : 


private volatile WaitNode waiters 


FutureTask 的 构造 方法 会 初始 化 callable 和 状态 ， 如 果 FutureTask 接 
受 的 是 一 个 Runnable 对 象 ， 它 会 调用 Executors.callable 转 换 为 Callable 对 
象 ， 如 下 所 示 : 


public FutureTask(Runnable runnable, V result) { 
this.callable = Executors.callable(runnable, result); 
this,.state = NEW; //ensure visibility of callable 


任务 执行 服务 会 使 用 一 个 线程 执行 FutureTask 的 run 方 法 。run 方 法 
的 代码 为 : 


public void run() { 
if(state != NEW || 
IUNSAFE .compareAndSwapObject(this, runneroffset, 
null, Thread.currentThread())) 
return; 
try { 
Callable<V> c = callable; 
if(c != null && state == NEW) { 
V result,; 
boolean ran; 
try { 
result = c.call(); 
ran = true; 
} catch (Throwable ex) { 
result = null; 
ran = false; 
setException(ex); 


if(ran) 
set(result); 


} 
} finally { 
//runner must be non-null until state is settled to 
//prevent concurrent calls to run() 
runner = null; 
//state must be re-read after nulling runner to prevent 
//leaked interrupts 
int s = state; 
if(s >= INTERRUPTING) 
handlePossibleCancellationInterrupt(s); 


} 
} 
其 基本 逻辑 是 : 


1) 调用 callable 的 cal] 方 法 ， 捕 获 任何 异 销 ; 
2) 如 果 正 常 执 行 完 成 ， 调 用 set 设 置 结 果 ， 保 存 到 outcome; 


3) 如 果 执 行 过 程 发 生 异 常 ， 调 用 setException 设 置 异常 ， 异 常 也 
是 保存 到 outcome， 但 状态 不 一 样 ; 


4) set 和 setException 除 了 设置 结果 、 修 改 状 态 外 ， 还 会 调用 
finishCompletion， 它 会 唤醒 所 有 等 竺 结果 的 线程 。 


对 于 任务 提交 者 ， 它 通过 get 方 法 获取 结 有 末 ， 限 时 get 方 法 的 代码 
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public V get(long timeout, TimeUnit unit) 

throws InterruptedException, ExecutionException, TimeoutException { 

if(unit == null) 
throw new NullpointerException(); 

int s = state; 

if(s <= COMPLETING && 
(Ss = awaitDone(true, unit.toNanos(timeout))) <= COMPLETING) 
throw new TimeoutException(); 

return report(s); 


其 基本 逻辑 是 ， 如 琳 任 务 还 未 执行 完毕 ， 束 等 每 ， 最 后 调用 report 
报告 结果 ，report 根 据 状态 返回 结果 或 抛 出 异常 ， 代 码 为 : 


private V report(int s) throws ExecutionException { 
Object x = outcome; 


if(s == NORMAL) 
return (V)x; 
if(s >= CANCELLED ) 
throw new CancellationException(); 
throw new ExecutionException( (Throwable)x); 


} 


cance] 方 法 的 代码 为 : 


public boolean cancel(boolean mayInterruptIfRunning) { 
if(state != NEW) 
return false,; 
if(mayInterruptIfRunning) { 
if(!UNSAFE.compareAndSwapInt(this, stateOoffset, NEW, 
return false,; 
Thread t = runner; 
if(t != null) 
t.interrupt(); 
UNSAFE .putOrderedInt(this, stateoffset, INTERRUPTED); // final state 


INTERRUPTING ) ) 


} 
else if(!UNSAFE.compareAndSwapInt(this, stateoffset, NEW, CANCELLED ) ) 


return false,; 
finishCompletion(); 
return true; 


其 基本 逻辑 为 : 
如 采 任 务 已 结束 或 取消 ， 返 回 false; 


-如果 mayInterruptIfRunning 为 true， 调 用 interrupt 中 汤 线 程 ， 设 置 
状态 为 INTERR-UPTED: 


-如果 mayInterruptIfRunning 为 false， 设 置 状 态 为 CANCELLED; 


.调用 finishCompletion 唤 醒 所 有 等 竺 结 采 的 线程 。 


18.14 小 结 


本 节 介 绍 了 Java 并 发 包 中 任务 执行 服务 的 基本 概念 和 原理 ， 该 服 
务 体现 了 并 发 异步 开发 中 “关注 点 分 离 ” 的 思想 ， 使 用 者 只 需要 通过 
ExecutorService 提 交 人 任务， 通过 Future 操 作 任 务 和 结果 即 可 ， 不 需要 关 


注 线程 创建 和 协调 的 细 世 。 


本 广 主 要 介绍 了 AbstractExecutorService 和 FutureTask 的 基本 原理 ， 
实现 了 一 个 最 简单 的 执行 服务 SimpleExecutorService， 对 每 个 任务 创建 
一 个 单独 的 线程 。 实 际 中 ， 最 经 常 使 用 的 执行 服务 是 基于 线程 池 实 现 
的 ThreadPoolExecutor， 让 我 们 下 一 节 来 探讨 。 


18.2 ”线程 池 


线程 池 走 并 发 程序 中 一 个 非常 重要 的 概念 和 技术 。 线程 池 ， 顾 名 
思 义 ， 就 是 一 个 线程 的 池子 ， 里 面 有 寿 干 线程 ， 它 们 的 目的 束 古 执行 
提交 给 线程 池 的 任务 ， 执 行 完 一 个 任务 后 不 会 退出 ， 而 是 继续 等 竺 或 
执行 狐 任务 。 线 程 池 主 要 由 两 个 概念 组 成 : 一 个 是 任务 队列 ; 男 一 个 
征 工 作者 线程 。 工 作者 线程 主体 就 是 一 个 循环 ， 循 环 从 队列 中 接受 任 
务 并 执行 ， 任 务 队列 保存 待 执行 的 任务 。 


线程 池 的 概念 类 似 于 生活 中 的 一 些 排队 场景 ， 比 如 在 医院 排队 挂 
号 、 在 银行 排队 办 理 业 务 等 ， 一 般 痢 由 洛 干 窗口 提供 服务 ， 这 些 服务 
窗口 类 似 于 工作 者 线程 ， 队 列 的 概念 十 类 似 的 ， 只 是 在 现实 场景 中 ， 
每 个 窗口 经 常 有 一 个 单独 的 队列 ， 这 种 排队 难以 公平 ， 随 着 信息 化 的 
发 展 ， 越 来 越 多 的 排队 场合 使 用 虚拟 的 统一 队列 ， 一 般 都 古 先 拿 一 个 
排队 号 ， 然 后 按 号 依次 服务 。 


线程 池 的 优点 是 显而易见 的 : 
它 可 以 重用 线程 ， 避 免 线程 创建 的 开销 。 


”一 任务 过 多 时 ， 通 过 排队 避免 创建 过 多 线程 ， 减 少 系统 资源 消耗 和 
竞争 ， 确 保 任务 有 序 完 成 。 


Java 并 发 包 中 线程 池 的 实现 类 是 ThreadPoolExecutor， 它 继承 上 自 
AbstractExecutor-Service， 实 现 了 ExecutorService， 基 本 用 法 与 上 节 介 
绍 的 类 似 ， 我 们 惑 不 警 述 了 。 不 过 ，ThreadPoolExecutor 有 一 些 重要 的 
参数 ， 理 解 这 些 参 数 对 于 合理 使 用 线程 池 非 常 重要 ， 接 下 来 ， 我 们 探 


讨 这 些 参数 。 


18.2.1 ”理解 线 程 池 


先 来 看 ThreadPoolExecutor 的 构造 方法 。ThreadPoolExecutor 有 多 
个 构造 方法 ， 都 需要 一 些 参 数 ， 主 要 构造 方法 有 : 


public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, 
long keepAliveTime, TimeUnit unit, BlockingQueue<RuNnable> workQueue) 
public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, 
long keepAliveTime, TimeUnit unit, BlockingQueue<RuUuNnable> workQueue, 
ThreadFactory threadFactory, RejectedExecutionHandler handler) 


第 二 个 构造 方法 多 了 两 个 参数 threadFactory 和 handler， 这 两 个 参 
数 一 般 不 需要 ， 第 一 个 构造 方法 会 设置 默认 值 。 参 数 corePoolSize、 
maximumPoolSize、keepAliveTime、unit 用 于 控制 线程 池 中 线程 的 个 
数 ，workQueue 表 示 任 务 队列 ，threadFactory 用 于 对 创建 的 线程 进行 一 
些 配 置 ，handler 表 示 任 务 拒绝 全 略 。 下 面 我 们 详细 探讨 下 这 些 参数 。 


1. 线 程 池 大 小 
线程 池 的 大 小 主要 与 4 个 参数 有 大: 


:corePoolSize: 核心 线程 个 数 。 


.naximumPoolSize: 最 大 线程 个 数 。 
:keepAliveTime 和 unit 空闲 线程 存活 时 间 。 


maximumPoolSize 表 示 线 程 池 中 的 最 多 线程 数 ， 线 程 的 个 数 会 动 
人 态 变 化 ， 但 这 是 最 大 值 ， 不 管 有 多 少 任务 ， 都 不 会 创建 比 这 个 值 大 的 
线程 个 数 。corePoolSize 表 示 线 程 池 中 的 核心 线程 个 数 ， 不 过 ， 并 不 是 
0 刚 创 建 一 个 线程 池 后 ， 实 际 上 并 不 会 创建 


一 般 情 况 下 ， 有 新 任务 到 来 的 时 候 ， 如 果 当 前 线程 个 数 小 于 
corePoolSiz， 就 会 创建 一 个 新 线程 来 执行 该 任务 ， 需 要 说 明 的 是 ， 即 
使 其 他 线程 现在 也 是 空 闻 的 ， 也 会 创建 新 线程 。 不 过 ， 如 果 线 程 个 数 
大 于 等 于 corePoolSiz， 那 瓯 不 会 立即 创建 新 线程 了 ， 它 会 先 党 试 排 
队 ， 需 要 强调 的 是 ， 它 是 “ 竹 试 ?排队 ， 而 不 是 “阻塞 等 竺 "入 队 ， 如 果 
队列 满 了 或 其 他 原因 不 能 立即 入 队 ， 它 就 不 会 排队 ， 而 是 检查 线程 个 
数 是 否 达 到 了 maximumPoolSize， 如 果 没 有 ， 就 会 继续 创建 线程 ， 直 
到 线程 数 达 到 maximumPoolSize。 


keepAliveTime 的 目的 是 为 了 释放 多 余 的 线程 资源 ， 它 表示 ， 当 线 
程 池 中 的 线程 个 数 大 于 corePoolSize 时 额外 空 兴 线程 的 存活 时 间 。 人 也 惑 
是 说 ， 一 个 非 核心 线程 ， 在 空闲 等 竺 新 任务 时 ， 会 有 一 个 最 长 等 竺 时 


间 ， 即 keepAliveTime， 如 有 果 到 了 时 间 还 是 没有 新 任务 ， 了 驶 会 被 终止 。 
如 采 该 值 为 0， 则 表示 所 有 线程 都 不 会 超时 终止 。 

这 几 个 参数 除了 可 以 在 构造 方法 中 进行 指定 外 ， 还 可 以 通 
getter/setter 方 法 进行 查看 和 修改 。 


除了 这 些 静 态 参 数 ，ThreadPoolExecutor 还 可 以 查看 关于 线程 和 任 
务 数 的 一 些 动态 数字 : 
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2. 队 列 

ThreadPoolExecutor 要 求 的 队列 类 型 是 阻塞 队列 BlockingQueue， 
0 它们 都 可 以 用 作 线 程 池 的 队 
|， 比 如 : 


:LinkedBlockingQueue: 基于 链表 的 阻塞 队列 ， 可 以 指定 最 大 长 
度 ， 但 默认 是 无 界 的 。 


.ArrayBlockingQueue: 基于 数组 的 有 界 阻 塞 队 列 。 
.PriorityBlockingQueue: 基于 堆 的 无 界 阻 塞 优 先 级 队列 。 
:SynchronousQueue: 没有 实际 存储 空间 的 同步 阻塞 队列 。 

如 果 用 的 是 无 界 队 列 ， 需 要 强调 的 是 ， 线 程 个 数 最 多 只 能 达到 


corePoolSize， 到 达 core-PoolSize 后 ， 新 的 任务 总 会 排队 ， 参 数 
maximumPoolSize 也 就 没有 意义 了 。 


对 于 SynchronousQueue， 我 们 知道 ， 它 没有 实际 存储 元 素 的 空 
间 ， 当 尝试 排队 时 ， 只 有 正好 有 空闲 线程 在 等 等 接受 任务 时 ， 才 会 入 
队 成 功 ， 否 则 ， 总 是 会 创建 新 线程 ， 直 到 达到 maximumPoolSize 。 


3. 任 务 拒绝 策略 


如 果 队 列 有 界 ， 且 maximumPoolSize 有 限 ， 则 当 队 列 排 满 ， 线 程 
个 数 也 达到 了 maxi-mumPoolSize， 这 时 ， 新 任务 来 了 ， 如 何 处 理 呢 ? 
此 时 ， 会 触发 线程 池 的 任务 拒绝 策略 。 


默认 情况 下 ， 提 交 任 务 的 方法 (如 execute/submit/invokeAll 等 ) 会 
抛 出 异常 ， 类 型 为 RejectedExecutionException 。 


不 过 ， 拒 绝 策 略 是 可 以 目 定 义 的 ，ThreadPoolExecutor 实 现 了 4 种 
处 理 方式 。 


1) ThreadPoolExecutor.AbortPolicy: 这 就 是 默认 的 方式 ， 抛 出 异 
吊 O 

2) ThreadPoolExecutor.DiscardPolicy: 静 稚 处 理 ， 忽 略 新 任务 ， 
不 抛 出 异常 ， 也 不 执行 。 


3) ThreadPoolExecutor.DiscardOldestPolicy: 将 等 待 时间 最 长 的 任 
务 扔 掉 ， 然 后 目 己 排队 。 


4) ThreadPoolExecutor.CallerRunsPolicy: 在 任务 提交 者 线程 中 执 
行 任务 ， 而 不 是 交 给 线程 池 中 的 线程 执行 。 


它们 都 是 ThreadPoolExecutor 的 public 静 态 内 部 类 ， 都 实现 了 
RejectedExecutionHandler 接 口 ， 这 个 接口 的 定义 为 : 


public interface RejectedExecutionHandler 
void rejectedExecution(Runnable r, ThreadPoolExecutor executor); 


} 


当 线 程 池 不 能 接受 任务 时 ， 调 用 其 拒绝 策略 的 rejectedExecution 方 


法 。 
拒绝 策略 可 以 在 构造 方法 中 进行 指定 ， 也 可 以 通过 如 下 方法 进行 
日 定 : 


public void setRejectedExecutionHandler(RejectedExecutionHandler handler) 


”默认 的 RejectedExecutionHandler 是 一 个 AbortPolicy 实 例 ， 如 下 所 
个 \: 


private static final RejectedExecutionHandler defaultHandler = 
new AbortPolicy(); 


而 AbortPolicy 的 rejectedExecution 实 现 就 是 抛 出 异常 ， 如 下 所 示 : 


public void rejectedExecution(Runnable r, ThreadPoolExecutor e) { 
throw new RejectedExecutionException("Task " + r.toString() + 
" rejected from " + e.toString()); 


} 


我 们 需要 强调 下 ， 拒 绝 策 略 只 有 在 队列 有 界 ， 且 
maximumPoolSize 有 限 的 情况 下 才 会 触发 。 如 果 队 列 无 界 ， 服 务 不 了 
的 任务 总 是 会 排队 ， 但 这 不 一 定 是 期 望 的 结果 ， 因 为 请 求 处 理 队 列 可 
能 会 消耗 非常 大 的 内 存 ， 甚 至 引发 内 存 不 够 的 异常 。 如 果 队 列 有 界 但 
maxi-mumPoolSize 无 限 ， 可 能 会 创建 过 多 的 线程 ， 占 满 CPU 和 内 存 ， 
使 得 任何 任务 都 难以 完成 。 所 以 ， 在 任务 量 非常 大 的 场景 中 ， 让 拒绝 
策略 有 机 会 执行 是 保证 系统 稳定 运行 很 重要 的 方面 。 


4. 线 程 工厂 


线程 池 还 可 以 接受 一 个 参数 :ThreadFactory。 它 是 一 个 接口 ， 定 
义 为 : 


public interface ThreadFactory { 
Thread newThread(Runnable r); 


这 个 接口 根据 Runnable 创 建 一 个 Thread，ThreadPoolExecutor 的 默 
认 实 现 是 Executors 类 中 的 静态 内 部 类 DefaultThreadFactory， 主 要 就 是 
创建 一 个 线程 ， 给 线程 设置 一 个 名 称 ， 设 置 daemon 属 性 为 false， 设 置 
线程 优先 级 为 标准 默认 优先 级 ， 线 程 名 称 的 格式 为 ，pool-< 线 程 池 编 
号 >-thread-< 线 程 编 号 >。 如 果 需 要 自 定 义 一 些 线程 的 属性 ， 比 如 名 
称 ， 可 以 实现 目 定义 的 ThreadFactory 。 


5. 天 于 核心 线程 的 特殊 配置 


线程 个 数 小 于 等 于 corePoolSize 时 ， 我 们 称 这 些 线程 为 核心 线程 ， 
默认 情况 下 。 


-核心 线程 不 会 预先 创建 ， 只 有 当 有 任务 时 才 会 创建 


-核心 线程 不 会 因为 空间 而 被 终止 ，keepAliveTime 参 数 不 适 用 于 
它 。 


不 过 ，ThreadPoolExecutor 有 如 下 方法 ， 可 以 改变 这 个 默认 行为 。 


// 预 先 创建 所 有 的 核心 线程 
public int prestartAllcoreThreads() 

// 创 建 一 个 核心 线程 ， 如 果 所 有 核心 线程 都 已 创建 ， 则 返回 false 
public boolean prestartCoreThread() 
// 如 果 参 数 为 true， 则 keepAliveTime 参 数 也 适用 于 核心 线程 
public void allowCoreThreadTimeOut(boolean value) 


18.2.2 ”工厂 类 Executors 


类 Executors 提 供 了 一 些 静 态 工 厂 方法 ， 可 以 方便 地 创建 一 些 预 配 
置 的 线程 池 ， 主 要 方法 有 : 


public static ExecutorService newSingleThreadExecutor() 
public static ExecutorService newFixedThreadPool(int nThreads) 
public static ExecutorService newCachedThreadPool() 


newSingleThreadExecutor 基 本 相当 于 调用 : 


newSingleThreadExecutor() { 
return new ThreadPoolExecutor(1, 1, OL, TimeUnit.MILLISECONDS, 
new LinkedBlockingQueue<RuNnable>()); 


只 使 用 一 个 线程 ， 使 用 无 界 队 列 LinkedBlockingQueue， 线 程 创建 
后 不 会 超时 终止 ， 该 线程 顺序 执行 所 有 任务 。 该 线程 池 适 用 于 需要 确 
保 所 有 任务 被 顺序 执行 的 场合 。 


newFixedThreadPool 的 代码 为 : 


public static ExecutorService newFixedThreadPool(int nThreads) { 
return new ThreadPoolExecutor(nThreads, nThreads, OL, 
TimeUnit.MILLISECONDS, new LinkedBlockingQueue<RUNnable>()); 
} 


使 用 固定 数目 的 n 个 线程 ， 使 用 无 界 队 列 LinkedBlockingQueue， 
线程 创建 后 不 会 超时 终止 。 和 newSingleThreadExecutor 一 样 ， 由 于 是 
无 界 队 列 ， 如 有 果 排 队 任务 过 多 ， 可 能 会 消耗 这 多 的 内 存 。 


newCachedThreadPool 的 代码 为 : 


public static ExecutorService newCachedThreadPool() { 
return new ThreadPoolExecutor(0, Integer.MAX VALUE, 60L, 
TimeUnit.SECONDS, new SynchronousQueue<RuNnnable>()); 


} 


它 的 corePoolSize 为 0，maximumPoolSize 为 IntegerMAX_VALUE， 
keepAliveTime 是 60 秒 ， 队 列 为 SynchronousQueue。 它 的 含义 是 : 当 新 
任务 到 来 时 ， 如 果 正 好 有 空闲 线程 在 等 得 任务 ， 则 其 中 一 个 空 闪 线程 
接受 该 任务 ， 否 则 束 总 是 创建 一 个 新 线程 ， 创 建 的 总 线程 个 数 不 受 限 
制 ， 对 任 一 空 闪 线程 ， 如 果 60 秒 内 没有 新 任务 ， 就 终止 。 


实际 中 ， 应 该 使 用 newFixedThreadPool 还 是 newCachedThreadPool 


呢 ? 


在 系统 负载 很 高 的 情况 下 ，newEFixedThreadPool 可 以 通过 队列 对 
狐 任 务 排队 ， 保 证 有 足够 的 资源 处 理 实际 的 任务 ， 而 
newCachedThreadPoo]l 会 为 每 个 任务 创建 一 个 线程 ， 导 致 创建 过 多 的 线 
程 竞 争 CPU 和 内 存 资源 ， 使 得 任何 实际 任务 都 难以 完成 ， 这 时 ， 
newFixedThreadPool 更 为 适用 。 


不 过 ， 如 果 系 统 负载 不 太 高 ， 单 个 任务 的 执行 时 间 也 比较 短 ， 
newCachedThreadPool 的 效率 可 能 更 高 ， 因 为 任务 可 以 不 经 排 了 从， 直接 
交 给 某 一 个 空闲 线程 。 


在 系统 负载 可 能 极 高 的 情况 下 ， 两 者 都 不 是 好 的 选择 ， 
newFixedThreadPool 的 问题 是 队列 过 长 ， 而 newCachedThreadPool 的 问 


题 是 线程 过 多 ， 这 时 ， 应 根据 具体 情况 目 定 义 ThreadPoolExecutor， 传 
递 合 适 的 参数 


18.2.3 ”线程 池 的 死 锁 


天 于 提交 给 线程 池 的 任务 ， 我 们 需要 注意 一 种 情况 ， 束 是 任务 之 
间 有 依赖 ， 这 种 情况 可 能 会 出 现 死 锁 。 比 如 任务 A， 在 它 的 执行 过 程 
中 ， 它 给 同样 的 任务 执行 服务 提交 了 一 个 任务 B， 但 需要 等 得 任务 B 结 


如 果 任 务 A 是 提交 给 了 一 个 单线 程 线程 池 ， 一 定 会 出 现 死 锁 ，A 在 
等 等 B 的 结果 ， 而 B 在 队列 中 等 每 被 调度 。 如 来 古 提 交 给 了 一 个 限定 线 
程 个 数 的 线程 池 ， 也 有 可 能 因 线程 数 限制 出 现 死 锁 。 


怎么 解决 这 种 问题 呢 ? 可 以 使 用 newCachedThreadPool 创 建 线程 
池 ， 让 线程 数 不 受 限 制 。 另 一 个 解决 方法 是 使 用 SynchronousQueue， 
它 可 以 避免 死 锁 ， 怎 么 做 到 的 呢 ? 对 于 普通 队列 ， 入 队 只 是 把 任务 放 
到 了 队列 中 ， 而 对 于 SynchronousQueue 来 说 ， 入 队 成 功 就 意味 着 已 有 
线程 接受 处 理 ， 如 果 入 队 失 败 ， 可 以 创建 更 多 线程 直到 
maximumPoolSize， 如 果 达 到 了 maximumPoolSize， 会 触发 拒绝 机 制 ， 
不 管 怎么 样 ， 都 不 会 死 锁 。 


18274 不 结 


本 世人 介绍 了 线程 池 的 基本 概念 ， 详 细 探 讨 了 其 主要 参数 的 含义， 
理解 这 些 参数 对 于 合理 使 用 线程 池 有 是 非常 重要 的 ， 对 于 相互 依赖 的 任 
务 ， 需 要 注意 避免 出 现 死 锁 。 


ThreadPoolExecutor 实 现 了 生产 者 /消费 者 模式 ， 工 作者 线程 束 古 
消费 者 ， 任 务 提 交 者 就 是 生产 者 ， 线 程 池 自 己 维护 任务 队列 。 当 我 们 
位 到 类 似 生 产 首 /消费 者 问题 时 ， 应 该 优先 考虑 直接 使 用 线程 池 ， 而 
非 “ 重 新 发 明 轮 子 ”"， 应 自己 管理 和 维护 消费 者 线程 及 任务 队列 。 


18.3 ”定时 任务 的 那些 陷阱 


本 节 控 讨 定 时 任务 ， 定 时 任务 的 应 用 场景 是 非常 多 的 ， 比 如 : 


亲 钟 程序 或 任务 提醒 ， 指 定时 间 叫 床 或 在 指定 日 期 提醒 还 信用 
监控 系统 ， 每 隔 一 段 时 间 采 集 下 系统 数据 ， 对 异常 事件 报警 。 
统计 系统 ， 一 般 姿 晨 一 定时 间 统 计 有 昨日 的 各 种 数据 指标 。 

在 Java 中 ， 主 要 有 两 种 方式 实现 定时 任务 : 


.使 用 java.util 包 中 的 Timer 和 TimerTask 。 


.使 用 Java 并 发 包 中 的 ScheduledExecutorService。 


它们 的 基本 用 法 都 是 比较 位 单 的 ， 但 如 果 对 它们 没有 足够 的 了 
解 ， 则 很 容易 陷入 其 中 的 一 些 陷阱 。 下 面 ， 我 们 整 来 介绍 它们 的 用 
法 、 原 理 以 及 那些 陷阱 


18.3.1 Timer 和 TimerTask 
我 们 先 介 绍 它们 的 基本 用 法 和 示例 ， 然 后 介绍 它们 的 实现 原理 和 
一 些 注意 事项 。 


1. 基 本 用 法 


TimerTask 表 示 一 个 定时 任务 ， 它 是 一 个 抽象 类 ， 实 现 了 
Runnable， 具 体 的 定时 任务 需要 继承 该 类 ， 实 现 run 方 法 。Timer 是 一 
个 具体 类 ， 它 负责 定时 任务 的 调度 和 执行 ， 主 要 方法 有 : 


// 在 指定 绝对 时 间 time 运 行 任务 task 

public void schedule(TimerTask task，Date time) 
// 在 当前 时 间 延 时 delay 毫 秒 后 运行 任务 task 

public void schedule(TimerTask task, long delay) 
// 固 定 延 时 重复 执行 ， 第 一 次 计划 执行 时 间 为 firstTime， 


// 后 一 次 的 计划 执行 时 间 为 前 一 次 "实际 "执行 时 间 加 上 period 

public void schedule(TimerTask task, Date firstTime, long period) 

// 同 样 是 固定 延 时 重复 执行 ， 第 一 次 执行 时 间 为 当前 时 间 加 上 delay 

public void schedule(TimerTask task, long delay, long period) 

// 固 定 频率 重复 执行 ， 第 一 次 计划 执行 时 间 为 firstTime， 

// 后 一 次 的 计划 执行 时 间 为 前 一 次 "计划 "执行 时 间 加 上 period 

public void scheduleAtFixedRate(TimerTask task, Date firstTime, long period) 
// 同 样 是 固定 频率 重复 执行 ， 第 一 次 计划 执行 时 间 为 当 总 前 时 间 加 上 delay 

public void scheduleAtFixedRate(TimerTask task, long delay, long period) 


需要 注意 固定 延 时 (fixed-delay) 与 固定 频率 (fixed-rate) 的 区 
别 ， 二 者 都 是 重复 执行 ， 但 后 一 次 任务 执行 相对 的 时 间 是 不 一 样 的 ， 
对 于 固定 延 时 ， 它 是 基于 上 次 任务 的 “实际 ”执行 时 间 来 算 的 ， 如 果 由 
于 某 种 原因 ， 上 次 任务 延 时 了 ， 则 本 次 任务 也 会 延 时 ， 而 固定 频率 会 
尽量 补 够 运行 次 数 。 


另外 ， 需 要 注意 的 是 ， 如 有 果 第 一 次 计划 执行 的 时 间 firstTime 征 一 
个 过 去 的 时 间 ， 则 任务 会 立即 运行 ， 对 于 固定 延 时 的 任务 ， 下 次 任务 
会 基于 第 一 次 执行 时 间 计 算 ， 而 对 于 固定 频率 的 任务 ， 则 会 从 
firstTime 开 始 算 ， 有 可 能 加 上 period 后 还 是 一 个 过 去 时 间 ， 从 而 连续 运 
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2. 基 本 示例 
看 一 个 最 简单 的 例子 ， 如 代码 清单 18-3 所 示 。 
代码 清单 18-3 ”Timer 基 本 示例 


public class BasicTimer { 
static class DelayTask extends TimerTask { 
QOverride 
public void run() { 
System,.out.printlin("delayed task"); 


public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer.schedule(new DelayTask(), 1000); 
Thread ,Sleep(2000) ; 
timer .cancel()， 


} 


创建 一 个 Timer 对 象 ，1 秒 钟 后 运行 DelayTask， 最 后 调用 Timer 的 
cancel] 方 法 取消 所 有 定时 任务 。 


看 一 个 固定 延 时 的 简单 例子 ， 如 代码 清单 18-4 所 示 。 
代码 清单 18-4 Timer 固 定 延 时 示例 


public class TimerFixedDelay { 
static class LongRunningTask extends TimerTask { 
QOverride 
public void run() { 
try { 
Thread.sleep(5000); 
} catch (InterruptedException e) { 
} 
System,.out.println("long running finished"); 


} 


static class FixedDelayTask extends TimerTask { 
QOverride 
public void run() { 
System.out.println(System.currentTimeMillis()); 
} 


public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer.schedule(new LongRunningTask(), 10); 
timer.schedule(new FixedDelayTask(), 100, 1000); 


有 两 个 定时 任务 ， 第 一 个 运行 一 次 ， 但 耗 时 5 秒 ， 第 二 个 是 重复 执 
行 ，1 秒 一 次 ， 第 一 个 先 运行 。 运 行 该 程序 ， 会 发 现 ， 第 二 个 任务 只 
在 第 一 个 任务 运行 结束 后 才 会 开始 运行 ， 运 行 后 1 秒 一 次 。 如 有 果 兰 换 上 
面 的 代码 为 固定 频率 ， 即 变 为 代码 清单 18-5 所 示 。 


代码 清单 18-5”Timer 国 定 频率 示例 


public class TimerFixedRate { 
static class LongRunningTask extends TimerTask { 
// 省 略 ,与 代码 清单 18- 4 一 样 


static class FixedRateTask extends TimerTask { 
// 省 略 , 与 代码 清单 18- 4 一样 

} 

public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer.schedule(new LongRunningTask(), 10); 
timer.scheduleAtFixedRate(new FixedRateTask(), 100, 1000); 


运行 该 程序 ， 第 二 个 任务 同样 只 有 在 第 一 个 任务 运行 结束 后 才 会 
运行 ， 但 它 会 把 之 前 没有 运行 的 次 数 补 过 来 ， 一 下 子 运行 5 次 ， 输 出 类 
似 下 面 这 样 : 


long running finished 
1489467662330 
1489467662330 
1489467662330 
1489467662330 
1489467662330 
1489467662419 


3. 基 本 原理 


Timer 内 部 主要 由 任务 队列 和 Timer 线 程 两 部 分 组 成 。 任 务 队列 是 
一 个 基于 堆 实 现 的 优先 级 队列 ， 按 照 下 次 执行 的 时 间 排 优先 级 。Timer 
线程 负责 执行 所 有 的 定时 任务 ， 需 要 强调 的 是 ， 一 个 Timer 对 象 只 有 一 
个 Timer 线 程 ， 所 以 ， 对 于 上 面 的 例子 ， 任 务 会 被 延迟 。 


Timer 线 程 主体 古 一 个 循环， 从 队列 中 获取 任务 ， 如 果 队 列 中 有 任 
务 且 计划 执行 时 间 小 于 等 于 当前 时 间 ， 束 执行 它 ， 如 果 队 列 中 没有 任 
务 或 第 一 个 任务 延 时 还 没 到 ， 束 睡眠 。 如 果 睡 虐 过 程 中 队列 上 添加 了 
新 任务 且 新 任务 是 第 一 个 任务 ，Timer 线 程 会 被 唤醒 ， 重 新 进行 检查 。 


在 执行 任务 之 前 ，Timer 线 程 判断 任务 是 否 为 周 其 任务， 如果 是 ， 
束 设 置 下 次 执行 的 时 间 并 添加 到 优先 级 队列 中 ， 对 于 固定 延 时 的 任 
务 ， 下 次 执行 时 间 为 当前 时 间 加 上 period， 对 于 固定 频率 的 任务 ， 下 
次 执行 时 间 为 上 次 计划 执行 时 间 加 上 period 。 


需要 强调 是 ， 下 次 任务 的 计划 是 在 执行 当前 任务 之 前 就 做 出 了 
的 ， 对 于 固定 延 时 的 任务 ， 延 时 相对 的 是 任务 执行 前 的 当前 时 间 ， 而 
不 是 任务 执行 后 ， 这 与 后 面 讲 到 的 Sched-uledExecutorService 的 固定 延 
时 计算 方法 是 不 同 的 ， 后 者 的 计算 方法 更 合乎 一 般 的 期 望 。 对 于 固定 
频率 的 任务 ， 延 时 相对 的 是 最 先 的 计划 ， 上 所 以 ， 很 有 可 能 会 出 现 前 面 
例子 中 一 下 子 执行 很 多 次 任务 的 情况 。 


4. 死 循环 


一 个 Timer 对 象 只 有 一 个 Timer 线 程 ， 这 意味 着 ， 定 时 任务 不 能 耗 
时 太 长 ， 更 不 能 是 无 限 循 环 。 看 个 例子 ， 如 代码 清单 18-6 所 示 。 


代码 清单 18-6 ”Timer 死 循环 示例 


public class EndlessLoopTimer { 
static class LoopTask extends TimerTask { 
Q@override 
public void run() { 
while (true) { 


try { 
// 模 拟 执行 任务 
Thread ,Sleep(1000 ) ; 

} catch (InterruptedException e) { 
e.printStackTrace( ); 


} 
} 


} 
// 永 远 也 没有 机 会 执行 
static class ExampleTask extends TimerTask { 
Q@override 
public void run() { 
System.out.println("hello"); 
} 


public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer.schedule(new LoopTask(), 10); 
timer.schedule(new ExampleTask(), 100); 


} 
} 


第 一 个 定时 任务 是 一 个 无 限 循 环 ， 其 后 的 定时 任务 ExampleTask 将 
永远 没有 机 会 执行 。 
5. 异 第 处 理 

关于 Timer 线 程 ， 还 需要 强调 非常 重要 的 一 点 : 在 执行 任何 一 个 任 
务 的 run 方 法 时 ， 一 旦 run 抛 出 异常 ，Timer 线 程 就 会 退出 ， 从 而 所 有 定 
时 任务 都 会 被 取消 。 我 们 看 个 简单 的 示例 ， 如 代码 清单 18-7 所 示 。 


代码 清单 18-7 “Timer 有 异常 示例 


public class TimerException f{ 
static class TaskA extends TimerTask { 
Q@override 
public void run() { 


System.out.println("task A"); 


static class TaskB extends TimerTask { 
Q@Override 
public void run() { 
System.out.println("task B"); 
throw new RuntimeException(); 


} 


public static void main(String[] args) throws InterruptedException { 
Timer timer = new Timer(); 
timer.schedule(new TaskA(), 1, 1000); 
timer.schedule(new TaskB(), 2000, 1000); 
} 
} 


期 望 TaskA 每 秒 执行 一 次 ， 但 TaskB 会 抛 出 异常 ， 导 致 整个 定时 任 
务 补 取消， 程序 终止 ， 屏 幕 输出 为 : 


task A 

task A 

task B 

Exception in thread "Timer-0" java.lang.RuntimeException 
at laoma.demo.timer.TimerException$TaskB.run(TimerException.java:21) 
at java,util,TimerThread ,mainLoop(Timer, java:555 ) 
at java,util,TimerThread ,run(Timer,java:505 ) 


所 以 ， 如 果 希 望 各 个 定时 任务 不 互相 干扰 ， 一 定 要 在 run 方 法 内 捕 
获 所 有 异常 。 


6. 小 结 


SS Timer/TimerTask 的 基本 使 用 是 比较 简单 的 ， 但 我 们 需 
注意 : 


-后台 只 有 一 个 线程 在 运行 ; 

固定 频率 的 任务 被 延迟 后 ， 可 能 会 立即 执行 多 次 ， 将 次 数 补 够 ; 
-固定 延 时 任务 的 延 时 相对 的 是 任务 执行 前 的 时 间 

:不 要 在 定时 任务 中 使 用 无 限 循 环 ; 

一 个 定时 任务 的 未 处 理 异 常会 导致 所 有 定时 任务 被 取消 。 


18.3.2 ScheduledEXecutorService 


由 于 TimervTimerTask 的 一 些 问 题 ，Java 并 发 包 引 入 了 
ScheduledExecutorService， 下 面 我 们 介绍 它 的 基本 用 法 、 基 本 示例 和 
基本 原理 。 


1. 基 本 用 法 


ScheduledExecutorService 是 一 个 接口 ， 其 定义 为 : 


public interface ScheduledExecutorService extends ExecutorService { 
// 单 次 执行 ， 在 指定 延 时 delay 后 运行 command 
public ScheduledFuture<?> schedule(Runnable command, long delay, 


TimeUnit unit); 


TimeUnit unit); 
// 固 定 频率 重复 执行 
public ScheduledFuture<?> scheduleAtFixedRate(Runnable command, 
long initialDelay, long period, TimeUnit unit),; 
// 固 定 延 时 重复 执行 
public ScheduledFuture<?> scheduleWithFixedDelay(Runnable command, 
long initialDelay, long delay, TimeUnit unit); 


它们 的 返回 类 型 都 是 ScheduledFuture， 它 是 一 个 接口 ， 扩 展 了 
Future 和 Delayed， 没 有 定义 额外 方法 。 这 些 方法 的 大 部 分 语义 与 Timer 
中 的 基本 是 类 似 的 。 对 于 固定 频率 的 任务 ， 第 一 次 执行 时 间 为 
initialDelay 后 ， 第 二 次 为 initialDelay+period， 第 三 次 为 initial- 
Delay+2*period， 以 此 类 推 。 不 过 ， 对 于 固定 延 时 的 任务 ， 它 是 从 任务 
执行 后 开始 算 的 ， 第 一 次 为 initialDelay 后 ， 第 二 次 为 第 一 次 任务 执行 
0 ee ° 与 Timer 不 同 ， 它 不 支持 以 绝对 时 间作 为 首次 运 
行 的 时 间 。 


ScheduledExecutorService 的 主要 实现 类 是 
ScheduledThreadPoolExecutor， 它 是 线程 池 ThreadPoolExecutor 的 子 
类 ， 是 基于 线程 闻 实 现 的 ， 它 的 主要 构造 方法 是 : 


public ScheduledThreadPooJEXxecutor(int corePoolSize) 


此 外 ， 还 有 构造 方法 可 以 接受 参数 ThreadFactory 和 
RejectedExecutionHandler， 合 义 与 ThreadPoolExecutor 一 样 ， 我 们 天 不 
发 述 了 。 


它 的 任务 队列 是 一 个 无 界 的 优先 级 队列 ， 所 以 最 大 线程 数 对 它 没 
有 作用 ， 即 使 core-PoolSize 设 为 0， 它 也 会 至 少 运 行 一 个 线程 。 


工厂 类 Executors 也 提供 了 一 些 方便 的 方法 ， 以 方便 创建 
ScheduledThreadPoolExecutor， 如 下 上 所 示 : 


// 单 线程 的 定时 任务 执行 服务 
public static ScheduledExecutorService newSingleThreadScheduledExecutor() 
public static ScheduledExecutorService newSingleThreadScheduledExecutor( 
ThreadFactory threadFactory) 
// 多 线程 的 定时 任务 执行 服务 
public static ScheduledExecutorService newScheduledThreadPool( 
int corePoolSize) 
public static ScheduledExecutorService newScheduledThreadPool( 
int corePoolSize, ThreadFactory threadFactory) 


2. 基 本 示例 

由 于 可 以 有 多 个 线程 执行 定时 任务 ， 一 般 任务 就 不 会 被 某 个 长 时 
间 运 行 的 任务 所 延 坟 了。 比如 ， 对 于 代码 清单 18-4 所 示 的 
TimerFixedDelay， 如 果 改 为 代码 清单 18-8 所 示 : 


代码 清单 18-8 多 线程 的 定时 任务 执行 服务 示例 


public class ScheduledFixedDelay { 
static class LongRunningTask implements Runnable { 
// 省 略 ， 与 代码 清单 18 -4 一样 


static class FixedDelayTask :implements Runnable { 
// 省 略 ， 与 代码 清单 18 -4 一样 


public static void main(String[] args) throws InterruptedException { 
ScheduledExecutorService timer = Executors 
,newScheduJledThreadPool(10 ) ; 
timer .Schedule(new LongRunningTask(), 10, TimeUnit.MILLISECONDS); 
timer.schedulewithFixedDelay(new FixedDelayTask(), 100, 1000, 
TimeUnit ,MILLISECONDS ) ， 


再 次 执行 ， 第 二 个 任务 就 不 会 被 第 一 个 任务 延迟 了 。 


另外 ,， 与 Timer 不 同 ， 单 个 定时 任务 的 异常 不 会 再 导致 整个 定时 任 
务 被 取消 ， 即 使 后 台 只 有 一 个 线程 执行 任务 。 我 们 看 个 例子 ， 如 代码 
清单 18-9 所 示 。 


代码 清单 18-9 ScheduledExecutorService 异 常 示 例 


public class ScheduledException { 
static class TaskA implements Runnable { 
Q@Override 
public void run() { 
System.out.println("task A"); 
} 


static class TaskB implements Runnable { 
QOverride 
public void run() { 
System.out.println("task B"); 
throw new RuntimeException(); 


} 


public static void main(String[] args) throws InterruptedException { 
ScheduledExecutorService timer = Executors 
.NewSingleThreadSscheduledExecutor(); 
timer.schedulewithFixedDelay(new TaskA(), 0, 1, TimeUnit.SECONDS); 
timer.schedulewithFixedDelay(new TaskB(), 2, 1, TimeUnit.SECONDS); 
} 
} 


TaskA 和 TaskB 都 是 每 秒 执行 一 次 ，TaskB 两 秒 后 执行 ， 但 一 执行 
忠 抛 出 异 第 ,屏幕 的 输出 类 似 如 下 : 


task A 
task A 
task B 
task A 
task A 


这 说 明 ， 定 时 任务 TaskB 被 取消 了 ， 但 TaskA 不 受 影响 ， 即 使 它们 
是 由 同一 个 线程 执行 的 。 不 过 ， 需 要 强调 的 是 ， 与 Timer 不 同 ， 没 有 异 
常 被 抽出 ，TaskB 的 异常 没有 在 任何 地 方 体现 。 所 以 ， 与 Timer 中 的 任 
务 类 似 ， 应 该 捕获 所 有 异常 。 


3. 基 本 原理 


ScheduledThreadPoolExecutor 的 实现 思路 与 Timer 基 本 是 类 似 的 ， 
都 有 一 个 基于 堆 的 优先 级 队列 ， 保 存 待 执行 的 定时 任务 ， 它 的 主要 不 


同 是 : 
1) 它 的 背后 是 线程 池 ， 可 以 有 多 个 线程 执行 任务 。 


2) 它 在 任务 执行 后 再 设置 下 次 执行 的 时 间 ， 对 于 固定 延 时 的 任务 
更 为 合理 。 


3) 任务 执行 线程 会 捕获 任务 执行 过 程 中 的 所 有 异常 ， 一 个 定时 任 
务 的 异常 不 会 影响 其 他 定时 任务 ， 不 过 ， 发 生 腊 常 的 任务 (即使 是 一 
个 重复 任务 ) 不 会 再 被 调度 。 


Te 


本 万 介绍 了 Java 中 定时 任务 的 两 种 实现 方式 Timer 和 
ScheduledExecutorService， 和 需要 特别 注意 Timer 的 一 些 陷阱 ， 实 践 中 建 
议 使 用 ScheduledExecutorService 。 


它们 的 共同 局 限 是 不 太 胜任 复杂 的 定时 任务 调度 。 比 如 ， 每 周一 
和 周三 晚上 18: 00 到 22: 00， 每 半 小 时 执行 一 次 。 对 于 类 似 这 种 需 
求 ， 可 以 利用 我 们 之 前 在 第 7 章 介绍 的 日 期 和 时 间 处 理 方法 ， 或 者 利用 
更 为 强大 的 第 三 方 类 库 ， 比 如 Quartz (http://www.quartz-scheduler.org/ 
) o 


在 并 发 应 用 程序 中 ， 一 般 我 们 应 该 尽量 利用 高 层次 的 服务 ， 比 如 
各 种 并 发 容器 、 任 务 执行 服务 和 线程 池 等 ， 避 免 自 己 管理 线程 和 它们 
之 间 的 同步 。 但 在 个 别 情 况 下 ， 目 己 管理 线程 及 同步 是 必需 的 ， 这 
时 ， 除 了 利用 前 面 草 节 介绍 的 synchronized 显 式 锁 和 条 件 等 基本 工具 ， 
Java 并 发 包 还 提供 了 一 些 高 级 的 同步 和 协作 工具 ， 以 方便 实现 并 发 应 
用 ， 让 我 们 下 一 章 来 了 解 它们 。 


第 19 章 ”同步 和 协作 工具 类 

我 们 在 15.3 节 实现 了 线程 的 一 些 基本 协作 机 制 ， 那 是 利用 基本 的 
waitnotify 实 现 的 。 我 们 提 到 ，Java 并 发 包 中 有 一 些 专门 的 同步 和 协作 
工具 类 ， 本 章 ， 我 们 就 来 探讨 它们 。 具 体 工具 类 包括 : 

: 读 写 锁 ReentrantReadWriteLock 。 

.信号 量 Semaphore 。 

.倒计时 门 栓 CountDownLatch。 

.循环 栅栏 CyclicBarrier 。 


此 外 ， 有 一 个 实现 线程 安全 的 特殊 概念 : 线程 本 地 变量 
ThreadLocal， 本 章 也 会 进行 介绍 。 


与 第 15 章 介绍 的 显 式 锁 和 显 式 条 件 类 似 ， 除 了 ThreadLocal 外 ， 这 
些 同步 和 协作 类 都 是 基于 AQS 实 现 的 。 在 一 些 特定 的 同步 协作 场景 
中 ， 相 比 使 用 最 基本 的 waitnotify 以 及 显 式 锁 / 条 件 ， 它 们 更 为 方便 ， 
。 下 面 ， 我 们 惑 来 探讨 它们 的 基本 概念 、 用 法 、 用 途 和 基本 
尿 于 


19.1 读 写 锁 ReentrantReadWriteLock 


之 前 章节 我 们 介绍 了 两 种 锁 : synchronized 和 显 式 锁 
ReentrantLock， 对 于 同一 受 保 护 对 象 的 访问 ， 无 论 是 读 还 是 写 ， 它 们 
都 要 求 获得 相同 的 锁 。 在 一 些 场景 中 ， 这 是 没有 必要 的 ， 多 个 线程 的 
人 在 读 多 写 少 的 场景 中 ， 让 读 操作 并 行 可 以 明显 
种 高 性 能 。 


起 么 让 读 操 作 能 够 并 行 ， 又 不 影响 一 致 性 呢 ? 答案 是 使 用 读 写 
锁 。 在 Java 并 发 包 中 ， 接 口 ReadWriteLock 表 示 读 写 锁 ， 主 要 实现 类 是 
可 重 入 读 写 锁 ReentrantReadWriteLock。ReadWriteLock 的 定义 为 : 


public interface ReadwriteLock { 
Lock readLock(); 
Lock writeLock(); 


} 


通过 一 个 ReadWriteLock 广 生 两 个 锁 ， 一 个 读 锁 ， 一 个 写 锁 。 读 操 
作 使 用 读 锁 ， 写 操作 使 用 写 锁 。 需 要 注意 的 是， 只 有 “该 - 读 ? 操 作 走 可 
以 并 行 的 ,“ 读 - 写 ? 和 "“ 写 - 写 ? 都 不 可 以 。 只 有 一 个 线程 可 以 进行 写 操 
作 ， 在 获取 写 锁 时 ， 只 有 没有 任何 线程 持 有 任何 锁 才 可 以 获取 到 ， 在 
持 有 写 锁 时 ， 其 他 任何 线程 都 获取 不 到 任何 锁 。 在 没有 其 他 线程 持 有 
写 锁 的 情况 下 ， 多 个 线程 可 以 获取 和 持 有 读 锁 。 


ReentrantReadWriteLock 是 可 重 入 的 读 写 锁 ， 它 有 两 个 构造 方法 ， 
如 下 所 示 : 


public ReentrantLock() 
public ReentrantLock(boolean fair) 


fire 表 示 是 否 公平 ， 如 末 不 传递 则 古 false， 含 义 与 16.2 市 介绍 的 类 
似 ， 束 不 资 述 了 。 


我 们 看 个 读 写 锁 的 应 用 ， 使 用 ReentrantReadWriteLock 实 现 一 个 组 
存 类 MyCache， 如 代码 清单 19-1 所 示 。 


代码 请 单 19-1 ”使 用 读 写 锁 实 现 一 个 缓存 类 MyCache 


public class MyCache { 
private Map<String, Object> map = new HashMap<>(); 
private ReentrantReadwriteLock readwriteLock = 
new ReentrantReadwriteLock(); 
private Lock readLock = readwriteLock.readLock(); 
private Lock writeLock = readwriteLock.writeLock(); 
public Object get(String key) { 
readLock. lock(); 
try { 
return map.get(key); 
} finally { 
readLock.unlock( ); 


} 
public Object put(String key, Object value) { 
writeLock.1lock(); 


try { 

return map.put(key, value); 
} finally { 

writeLock.unlock(); 


} 
public void clear() { 
writeLock.1lock(); 


try { 
map.clear( ); 

} finally { 
writeLock.unlock(); 


代码 比较 简单 ， 就 不 颖 述 了 。 读 写 锁 是 怎么 实现 的 呢 ? 读 锁 和 写 
锁 看 上 去 是 两 个 锁 ， 它 们 是 怎么 协调 的 ? 具体 实现 比较 复杂 ， 我 们 简 
述 下 其 思路 。 


内 部 ， 它 们 使 用 同一 个 整数 变量 表示 锁 的 状态 ，16 位 给 读 锁 用 ， 
16 位 给 写 锁 用 ， 使 用 一 个 变量 便于 进行 CAS 操 作 ， 锁 的 等 得 队列 其 实 
也 只 有 一 个 
写 锁 的 获取 ， 束 是 确 你 当前 没有 其 他 线程 择 有 任何 锁 ， 人 否则 束 等 
。 写 锁 释 放 后 ， 也 束 是 将 等 待 队列 中 的 第 一 个 线程 唤醒 ， 唤 醒 的 可 
征 等 待 读 锁 的 ， 也 可 能 是 等 待 写 锁 的 。 
读 锁 的 获取 不 太一 样 ， 首 和 完 ， 只 要 写 锁 没 有 被 持 有 ， 束 可 以 获取 
到 读 锁 ， 此 外 ， 在 获取 到 读 锁 后 ， 它 会 检查 等 竺 队列， 逐个 唤醒 最 前 


待 
合 巴 
有 


面 的 等 待 读 锁 的 线程 ， 直 到 第 一 个 等 待 写 锁 的 线程 。 如 采 有 其 他 线程 
持 有 写 锁 ， 获 取 读 锁 会 等 等 。 读 锁 释 放 后 ， 检 查 读 锁 和 写 锁 数 是 否 都 
变 为 了 0， 如 采 是 ， 唤 醒 等 待 队列 中 的 下 一 个 线程 。 


19.2 ”信和 号 量 Semaphore 


之 前 介绍 的 锁 都 是 限制 只 有 一 个 线程 可 以 同时 访问 一 个 资源 。 现 
实 中 ， 资 源 往往 有 多 个 ， 但 每 个 同时 只 能 个 一 个 线程 访问 ， 比 如 ， 饭 
店 的 饭 昌 、 火 车 上 的 卫生 间 。 有 的 单个 资源 即使 可 以 被 并 发 访问 ， 但 
并 发 访问 数 多 了 可 能 影响 性 能 ， 所 以 希望 限制 并 发 访问 的 线程 数 。 还 
有 的 情况 ， 与 软件 的 授权 和 计 费 有 关 ， 对 不 同等 级 的 账户 ， 限 制 不 同 
的 最 大 并 发 访问 数 。 


信号 量 类 Semaphore 号 古 用 来 解决 这 类 问题 的 ， 它 可 以 限制 对 资源 
的 并 发 访问 数 ， 它 有 两 个 构造 方法 : 


public Semaphore(int permits) 
public Semaphore(int permits, boolean fair) 


fire 表 示 公 平 ， 含 义 与 之 前 介绍 的 是 类 似 的 ，permits 表 示 许 可 数 


wl 


Semaphore 的 方法 与 锁 是 类 似 的 ， 主 要 的 方法 有 两 类 ， 获 取 许可 和 
释放 许可 ， 主 要 方法 有 : 


// 阻 塞 获 取 许 司 

public void acquire() throws InterruptedException 

// 阻 塞 获取 许可 ， 不 响应 中 断 

public void acquireUninterruptibly() 

// 批 量 获取 多 个 许可 

public void acquire(int permits) throws InterruptedException 

public void acquireUninterruptibly(int permits) 

// 尝 试 获取 

public boolean tryAcquire() 

// 限 定 等 待 时 间 获 取 

public boolean tryAcquire(int permits, long timeout, 
TimeUnit unit) throws InterruptedException 

// 释 放 许 可 

public void release() 


iy 


我 们 看 个 简单 的 示例 ， 限 制 并 发 访问 的 用 户 数 不 超过 100， 如 代码 
清单 19-2 所 示 。 


代码 清单 19-2 ”Semaphore 应 用 示例 


public class AccessControlService { 
public static class ConcurrentLimitException extends RuntimeException { 
private static final long serialVersionUID = 1L， 


} 
private static final int MAX_PERMITS = 100,; 
private Semaphore permits = new Semaphore(MAX_PERMITS, true); 
public boolean login(String name, String password) { 
if(!permits.tryAcquire()) { 
// 同 时 登录 用 户 数 超过 限制 
throw new ConcurrentLimitException(); 


} 
//.… 其 他 验证 
return true; 


} 
public void logout(String name) { 
permits.release( ); 


代码 比较 简单 ， 束 不 葡 述 了 。 需 要 说 明 的 是 ， 如 果 我 们 将 permits 
的 值 设 为 1， 你 可 能 会 认为 它 束 变 成 了 一 般 的 锁 ， 不 过 ， 它 与 一 般 的 锁 
是 不 同 的 。 一 般 锁 只 能 由 持 有 锁 的 线程 释放 ， 而 Semaphore 表 示 的 只 是 
一 个 许可 数 ， 任 意 线程 都 可 以 调用 其 release 方 法 。 主 要 的 锁 实 现 类 
ReentrantLock 是 可 重 入 的 ， 而 Semaphore 不 是 ， 每 一 次 的 acquire 调 用 都 
会 消耗 一 个 许可 ， 比 如 ， 看 下 面 的 代码 段 : 


Semaphore permits = new Semaphore(1); 
permits.acquire( ); 

permits.acquire( ); 
System.out.println("acquired"); 


程序 会 阻塞 在 第 二 个 acquire 调 用 ， 永 远 都 不 会 输出 “acquired”。 


“信号 量 的 基本 原理 比较 简单 ， 也 是 基于 AQS 实 现 的 ，permits 表 示 
共享 的 锁 个 数 ，acquire 方 法 就 是 检查 颌 个 数 是 否 大 于 0， 大 于 则 减 一 ， 
获取 成 功 ， 否 则 就 等 待 ，release 就 是 将 锁 个 数 加 一 ， 唤 醒 第 一 个 等 待 
的 线程 。 


19.3 倒计时 门 栓 CountDownLatch 


我 们 在 15.3.5 克 使 用 waiVynotify 实 现 了 一 个 简单 的 门 栓 MyLatch， 
我 们 提 到 ，Java 并 发 包 中 已 经 提供 了 类 似 工 具 ， 就 是 
CountDownLatch。 它 相当 于 是 一 个 门 栓 ， 一 开始 是 关闭 的 ， 所 有 希望 
通过 该 门 的 线程 都 需要 等 每 ， 然 后 开始 倒计时 ， 倒 计时 变 为 0 后 ， 门 栓 
i 0 它 是 一 次 性 的 ， 打 开 后 就 不 能 再 


CountDownLatch 里 有 一 个 计数 ， 这 个 计数 通过 构造 方法 进行 传 


public CountDownLatch(int count) 
多 个 线程 可 以 基于 这 个 计数 进行 协作 ， 它 的 主要 方法 有 : 


public void await() throws InterruptedException 
public boolean await(long timeout, TimeUnit unit) throws InterruptedException 
public void countDown() 


await 检 查 计数 是 否 为 0， 如 果 大 于 0， 就 等 得 ，await 可 以 被 中 断 ， 
也 可 以 设置 最 和 等 竺 时间。 countDown 检 查 计数 ， 如 果 已 经 为 0， 直 接 
返回 ， 否 则 减少 计数 ， 如 果 新 的 计数 变 为 0， 则 唤醒 所 有 等 得 的 线程 。 


之 前 ， 我 们 介绍 了 门 栓 的 两 种 应 用 场景 : 一 种 是 同时 开始 ， 男 一 
种 是 主 从 协作 。 它 们 都 有 两 类 线程 ， 互 相 需 要 同步 ， 我 们 使 用 
CountDownLatch 重 新 演示 。 


在 同时 开始 场景 中 ， 运 行 员 线程 等 待 主 裁 判 线程 发 出 开始 指令 的 
信号 ， 一旦 发 出 后 ， 所 有 运动 员 线 程 同 时 开始 ， 计 数 初始 为 1， 运 动员 
线程 调用 await， 主 线程 调用 countDown， 如 代码 清单 19-3 所 示 。 


代码 清单 19-3 ”使 用 CountDownLatch 实 现 同 时 开始 场景 


public class RacerwithCountDownLatch { 
static class Racer extends Thread { 
CountDownLatch latch; 
public Racer(CountDownLatch latch) { 
this,.latch = latch,; 


QOverride 
public void run() { 
try { 
this.1latch.await(); 
System.out.println(getName() 
+ " Start run "+System,.currentTimeMillis()); 
} catch (InterruptedException e) { 
} 


} 
} 
public static void main(String[] args) throws InterruptedException { 
int num = 10; 
CountDownLatch latch = new CountDownLatch(1); 
Thread[] racers = new Thread[num]; 
for(int i = 0; i < num i++) { 
racers[i] = new Racer(latch); 
racers[i].start(); 


} 
Thread.sleep(1000); 
latch.countDown( ) ， 


代码 比较 简单 ， 就 不 警 述 了 。 在 主 从 协作 模式 中 ， 主 线程 依赖 工 
作 线 程 的 结果 ， 需 要 等 竺 工作 线程 结束 ， 这 时 ， 计 数 初始 值 为 工作 线 
程 的 个 数 ， 工 作 线 程 结束 后 调用 count-Down， 主 线程 调用 await 进 行 等 
待 ， 如 代码 清单 19-4 所 示 。 


代码 清单 19-4 使 用 CountDownLatch 实 现 主 从 协作 场景 


public class MasterwWorkerDemo { 
static class Worker extends Thread { 
CountDownLatch 1Latch 
public Worker(CountDownLatch latch) { 
this.latch = latch,; 


QOverride 
public void run() { 


try { 
// 模 拟 执行 任务 
Thread.sleep((int) (Math,random() * 1000)); 
// 模 拟 异 常情 况 
if(Math.random() < 0.02) { 
throw new RuntimeException("bad luck"); 
} 


} catch (InterruptedException e) { 
} finally { 
this.1latch.countDown( ); 


} 
} 


public static void main(String[] args) throws InterruptedException { 
int workerNum = 100; 
CountDownLatch latch = new CountDownLatch(workerNum); 
Worker[] workers = new Worker[workerNum]; 
for(int i = 0; i < workerNum; i++) { 
workers[i] = new Worker(latch); 
workers[i].start(); 


latch.await(); 
System.out.println("collect worker results"); 


需要 强调 的 是 ， 在 这 里 ，countDown 的 调用 应 该 放 到 finally 语 句 
中 ， 确 保 在 工作 线程 发 生 异 常 的 情况 下 也 会 被 调用 ， 使 主线 程 能 够 从 
await 调 用 中 返回 。 


19.4 循环 栅栏 CyclicBarrier 


我 们 在 15.3.7 节 使 用 wait/notify 实 现 了 一 个 简单 的 集合 点 
AssemblePoint， 我 们 提 到 ，jJava 并 发 包 中 已 经 提供 了 类 似 工具 ， 就 是 
CyclicBarrier。 它 相当 于 是 一 个 栅栏 ， 所 有 线程 在 到 达 该 栅栏 后 都 需要 
等 竺 其 他 线程 ， 等 所 有 线程 都 到 达 后 再 一 起 通过 ， 它 是 循环 的 ， 可 以 
用 作 重 复 的 同步 。 

CyclicBarrier 特 别 适 用 于 并 行 迭代 计算 ， 每 个 线程 负责 一 部 分 计 
算 ， 然 后 在 栅栏 处 等 竺 其 他 线程 完成 ， 所 有 线程 到 齐 后 ， 交 换 数 据 和 
计算 结果 ， 再 进行 下 一 次 迭代 。 


与 CountDownLatch 类 似 ， 它 也 有 一 个 数字 ， 但 表示 的 是 参与 的 线 
程 个 数 ， 这 个 数字 通过 构造 方法 进行 传递 : 


public CyclicBarrier(int parties ) 


它 还 有 一 个 构造 方法 ， 接 受 一 个 Runnable 参 数 ， 如 下 所 示 : 


public CyclicBarrier(int parties, Runnable barrierAction) 


这 个 参数 表示 栅栏 动作 ， 当 所 有 线程 到 达 桶 祷 后， 在 所 有 线程 执 
5 
A 行 。 


CyclicBarrier 的 主要 方法 残 是 await: 


public int await() throws InterruptedException, BrokenBarrierException 
public int await(long timeout, TimeUnit unit) throws InterruptedException, 
BrokenBarrierException, TimeoutException 


await 在 等 待 其 他 线程 到 达 栅 栏 ， 调 用 await 后 ， 表 示 上 自己 已 经 到 
达 ， 如 采 目 己 是 最 后 一 个 到 达 的 ， 束 执行 可 选 的 命令 ， 执 行 后 ， 唤 醒 
所 有 等 得 的 线程 ， 然 后 重 置 内 部 的 同步 计数 ， 以 循环 使 用 。 


await 可 以 被 中 断 ， 可 以 限定 最 长 等 竺 时间， 中 断 或 超时 后 会 抛 出 
异常 。 需 要 说 明 的 是 异常 BrokenBarrierException， 它 表示 栅栏 被 破坏 
了 ， 什 么 意思 呢 ? 在 CyclicBarrier 中 ， 参 与 的 线程 是 互相 影响 的 ， 只 要 
其 中 一 个 线程 在 调用 await 时 被 中 断 了 ， 或 者 超时 了 ， 桶 栏 束 会 被 破 
坏 。 此 外 ， 如 果 栅 栏 动作 抛 出 了 异常 ， 栅 栏 也 会 被 破坏 。 被 破坏 后 ， 
所 有 在 调用 await 的 线程 束 会 退出 ， 抛 出 BrokenBarrierException 。 


我 们 看 一 个 简单 的 例子 ， 多 个 游客 线程 分 别 在 集合 点 A 和 B 同 步 ， 
如 代码 清单 19-5 所 示 。 


代码 清单 19-5 ”CydlicBarrier 应 用 示例 


public class CyclicBarrierDemo { 
static class Tourist extends Thread { 
CyclicBarrier barrier; 
public Tourist(CyclicBarrier barrier) { 
this.barrier = barrier,; 


@Override 
public void run() { 
try { 
// 模 拟 先 各 自 独 立 运行 
Thread.sleep((int) (Math.random() * 1000)); 
// 集 合 点 A 
barrier.await( ); 
System.out.println(this.getName() + " arrived A " 
+ System.currentTimeMillis()); 
// 集 合 后 模拟 再 各 自 独 立 运行 
Thread.sleep((int) (Math.random() * 1000)); 
// 集 合 点 B 


barrier.await( ); 
System,out,printJln(this,getName() + " arrived B " 
+ System.currentTimeMillis()); 
} catch (InterruptedException e) { 
} catch (BrokenBarrierException e) { 


} 


public static void main(String[] args) { 
int num = 3; 
Tourist[] threads = new Tourist[num]; 
CyclicBarrier barrier = new CyclicBarrier(num, new Runnable() { 
QOverride 
public void run() { 
System,out,println("all arrived " + System.currentTimeMillis() 
+ " executed by " + Thread.currentThread().getName()); 


} 

}); 

for(int i = 0; i < num; i++) { 
threads[i] = new Tourist(barrier); 
threads[i].start(); 


} 


在 笔者 的 计算 机 中 的 一 次 输出 为 : 


all arrived 1490053578552 executed by Thread-1 
Thread-1 arrived A 1490053578555 
Thread-2 arrived A 1490053578555 
Thread-0 arrived A 1490053578555 
all arrived 1490053578889 executed by Thread-0 
Thread-0 arrived B 1490053578890 
Thread-2 arrived B 1490053578890 
Thread-1 arrived B 1490053578890 


多 个 线程 到 达 A 和 B 的 时 间 是 一 样 的 ， 使 用 CydlicBarrier， 达 到 了 
重复 同步 的 目的 。 


CyclicBarrier 与 CountDownLatch 可 能 容易 混淆 ， 我 们 强调 下 它们 
的 区 别 。 


1) CountDownLatch 的 参与 线程 是 有 不 同 角色 的 ， 有 的 负责 倒 计 
时 ， 有 的 在 等 竺 倒计时 变 为 0， 负 责 倒计时 和 等 竺 倒计时 的 线程 都 可 以 
有 多 个 ， 用 于 不 同 角 色 线 程 间 的 同步 。 


2) CydlicBarrier 的 参与 线程 角色 是 一 样 的 ， 用 于 同一 角色 线程 间 
的 协调 一 致 。 


3) CountDownLatch 是 一 次 性 的 ， 而 CyclicBarrier 是 可 以 重复 利用 
时 。 


19.5 理解 ThreadLocal 


本 世 ， 我 们 来 探讨 一 个 特殊 的 概念 : 线程 本 地 变量 。 在 Java 中 的 
实现 是 类 ThreadLocal， 它 是 什么 ?” 有 什么 用 ? 实现 原理 是 什么 ? 让 我 
们 接 下 来 逐步 探讨 。 


19.5.1 基本 概念 和 用 法 


线程 本 地 变量 是 说 ， 每 个 线程 都 有 同一 个 变量 的 独 有 揽 贝 。 这 个 
概念 听 上 去 比较 难以 理解 ， 我 们 先 直 接 来 看 类 TheadLocal 的 用 法 。 
ThreadLocal 是 一 个 泛 型 类 ， 接 受 一 个 类 型 参数 T， 它 只 有 一 个 空 的 构 
造 方法 ， 有 两 个 主要 的 public 方 法 : 


public T get() 
public void set(T value) 


set 就 是 设置 值 ，get 束 是 获取 值 ， 如 果 没 有 值 ， 返 回 null， 看 上 
去 ，ThreadLocal 就 是 一 个 单一 对 象 的 容 絮 ， 比 如 : 


public static void main(String[] args) { 
ThreadLocal<Integer> local = new ThreadLocal<>(); 
local.set(100); 
System.out.println(local.get()); 


输出 为 100。 那 ThreadLocal 有 什么 特殊 的 呢 ? 特殊 发 生 在 有 多 个 
线程 的 时 候 ， 看 个 例子 : 


public class ThreadLocalBasic { 
static ThreadLocal<Integer> local = new ThreadLocal<>(); 
public static void main(String[] args) throws InterruptedException { 
Thread child = new Thread() { 
Q@override 
public void run() { 
System,out,println("child thread initial: " + local.get()); 
local.set(200); 
System,out,printJln("child thread final: ”+ local.get()); 
} 
}; 


local.set(100); 

child.start(); 

child.join(); 

System,out,printJln("main thread final: " + local.get()); 


local 是 一 个 静态 变量 ，main 方 法 创建 了 一 个 子 线程 child，main 和 和 
child 都 访问 了 local， 程 序 的 输出 为 : 


child thread initial: null 
child thread final: 200 
main thread final: 100 


这 说 明 ，main 线 程 对 local 变 量 的 设置 对 child 线 程 不 起 作用 ，child 
线程 对 local 变 量 的 改变 也 不 会 影响 main 线 程 ， 它 们 访问 的 虽然 是 同一 
0 但 每 个 线程 都 有 自己 的 独立 的 值 ， 这 就 是 线程 本 地 变量 

J 


除了 get/set，ThreadLocal 下 有 两 个 方法 : 


protected T initialValue() 
public void remove() 


initialValue 用 于 提供 初始 值 ， 这 是 一 个 受 保护 方法 ， 可 以 通过 匿 
名 内 部 类 的 方式 提供 ， 当 调用 get 方 法 时 ， 如 果 之 前 没有 设置 过 ， 会 调 
用 该 方法 获取 初始 值 ， 默 认 实现 是 返回 null。remove 删 挥 当前 线程 对 
应 的 值 ， 如 琳 删 挥 后 ， 再 次 调用 get， 会 再 调用 initialValue 获 取 初 始 
值 。 看 个 简单 的 例子 : 


public class ThreadLocalInit { 
static ThreadLocal<Integer> local = new ThreadLocal<Integer>(){ 
QOverride 
protected Integer initialValue() { 
return 100; 


}; 

public static void main(String[] args) { 
System.out.printljn(local.get()); 
local.set(200); 
local.remove( ); 
System.out.println(local.get()); 


} 


输出 值 都 是 100。 


19.5.2 ”使 用 场景 


ThreadLocal 有 什么 用 呢 ? 我 们 来 看 三 个 例子 : 日 期 处 理 、 随 机 数 
和 上 下 文 信息 。 


1. 日 期 处 理 


ThreadLocal 是 实现 线程 安全 的 一 种 方案 ， 比 如 对 于 
DateFormat/SimpleDateFormat， 我 们 在 介绍 日 期 和 时 间 操 作 的 时 候 ， 
提 到 它们 是 非 线程 安全 的 ， 实 现 安 全 的 一 种 方式 是 使 用 锁 ， 男 一 种 方 
式 是 每 次 都 创建 一 个 新 的 对 象 ， 更 好 的 方式 束 是 使 用 ThreadLocal， 
个 线程 使 用 自己 的 DateFormat， 束 不 存在 安全 问题 了 ， 在 线程 的 整个 
i 只 需要 创建 一 次 ， 叉 避免 了 频繁 创建 的 开销 ， 示 例 代 码 

下: 


public class ThreadLocalDateFormat { 
static ThreadLocal<DateFormat> sdf = new ThreadLocal<DateFormat>() { 


QOverride 
protected DateFormat initialValue() { 
return new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); 


} 


}; 
public static String date2String(Date date) { 
return sdf.get().format(date); 


} 
public static Date string2Date(String str) throws ParseException { 
return sdf.get().parse(str); 
} 
} 


需要 说 明 的 是 ，ThreadLocal 对 象 一 般 都 定义 为 static， 以 便于 引 


2. 随 机 数 


即使 对 象 是 线程 安全 的 ， 使 用 ThreadLocal 也 可 以 减少 竞争 ， 比 
如 ， 我 们 在 介绍 Random 类 的 时 候 提 到 ，Random 是 线程 安全 的 ， 但 如 
果 并 发 访问 竞争 激烈 的 话 ， 性 能 会 下 降 ， 所 以 Java 并 发 包 提 供 了 类 


ThreadLocalRandom, ee 利用 了 ThreadLocal， 它 没 
有 public 的 构造 方法 ， 通 过 静态 方法 current 获 取 对 象 ， 比 如 : 


public static void main(String[] args) { 
ThreadLocalRandom rnd = ThreadLocalRandom.current(); 
System.out.println(rnd.nextInt()); 

} 


current 方 法 的 实现 为 : 


public static ThreadLocalRandom current() { 
return localRandom.get(); 


localRandom 就 是 一 个 ThreadLocal 变 量 : 


private static final ThreadLocal<ThreadLocalRandom> localRandom = 
new ThreadLocal<ThreadLocalRandom>() { 
protected ThreadLocalRandom initialValue() { 
return new ThreadLocalRandom( ) ， 
} 


}; 


3. 上 下 文 信息 


ThreadLocal 的 典型 用 途 是 提供 上 下 文 信息 ， 比 如 在 一 个 Web 服 务 
器 中 ， 一 个 线程 执行 用 户 的 请 求 ， 在 执行 过 程 中 ， 很 多 代码 都 会 访问 
一 些 共同 的 信息 ， 比 如 请 求 信息 、 用 户 身份 信息 、 数 据 库 连接 、 当 前 

务 等 ， 它 们 是 线程 执行 过 程 中 的 全 局 信息 ， 如 果 作为 参数 在 不 同 代 
码 间 传递 ， 代 码 会 很 烦琐， 这 时 ， 使 用 ThreadLocal 就 很 方便 ， 所 以 它 
被 用 于 各 种 框架 如 Spring 中 。 我 们 看 个 简单 的 示例 ， 如 代码 清单 19-6 所 
RR? 


代码 清单 19-6 ”使 用 ThreadLocal 保 存 上 下 文 信息 


public class RequestContext { 
public static class Request { //... 


private static ThreadLocal<String> localUserId = new ThreadLocal<>(); 
private static ThreadLocal<Request> localRequest = new ThreadLocal<>(); 
public static String getCurrentUserId() { 


return localUserId.get(); 


public static void setCurrentUserId(String UserId) { 
localUserId.set(userId); 


} 
public static Request getCurrentRequest() { 
return localRequest.get(); 


public static void setCurrentRequest(Request request) { 
localRequest.set(request); 
} 


} 


在 首次 获取 到 信息 时 ， 调 用 set 方 法 如 
setCurrentRequest/setCurrentUserId 进 行 设置 ， 然 后 就 可 以 在 代码 的 任 
意 其 他 地 方 调用 get 相 关 方 法 进行 获取 了 。 


19.5.3 ”基本 实现 原理 


ThreadLocal 是 怎么 实现 的 呢 ? 为 什么 对 同一 个 对 象 的 getset， 
个 线程 都 能 有 自己 独立 的 值 呢 ? 我 们 直接 来 看 代码 (基于 Java 7) 。 
set 方 法 的 代码 为 : 


public void set(T value) { 
Thread t = Thread.currentThread( ); 
ThreadLocalMap map = getMap(t); 
if(map != null) 
map.set(this, value); 
else 
createMap(t, value); 


它 调 用 了 getMap，getMap 的 代码 为 : 


ThreadLocalMap getMap(Thread t) { 
return t,threadLocals 
} 


返回 线程 的 实例 变量 threadLocals， 它 的 初始 值 为 null， 在 null 时 ， 
set 调 用 createMap 初 始 化 ， 代 码 为 : 


void createMap(Thread t, T firstValue) { 
t.threadLocals = new ThreadLocalMap(this, firstValue); 


从 以 上 代码 可 以 看 出 ， 每 个 线程 都 有 一 个 Map， 类 型 为 
ThreadLocalMap， 调 用 set 实 际 上 有 是 在 线程 目 己 的 Map 里 设置 了 一 个 条 
目 ， 键 为 当前 的 ThreadLocal 对 象 ， 值 为 value。ThreadLocalMap 是 一 个 
内 部 类 ， 它 是 专门 用 于 ThreadLocal 的 ， 与 一 般 的 Map 不 同 ， 它 的 键 类 
型 为 WeakReference<ThreadLocal>。 我 们 没有 提 过 WeakReference,， 它 
与 Java 的 垃圾 回收 机 制 有 关 ， 使 用 它 ， 便 于 回收 内 存 ， 有 具体 我 们 融 不 


探讨 了 。 
get 方 法 的 代码 为 : 


public T get() { 
Thread t = Thread.currentThread(); 
ThreadLocalMap map = getMap(t); 
if(map != null) { 
ThreadLocalMap.Entry e = map.getEeEntry(this); 
if(e != null) 
return (T)e.value; 


return setInitialValue(); 


} 


通过 线程 访问 到 Map， 以 ThreadLocal 对 和 象 为 刍 从 Map 中 获取 到 条 
目 ， 取 其 value， 如 果 Map 中 没有 ， 则 调用 setInitialValue， 其 代码 为 : 


private T setInitialValue() { 
T value = initialValue(); 
Thread t = Thread.currentThread(); 
ThreadLocalMap map = getMap(t); 
if(map != null) 
map.set(this, value); 
else 
createMap(t, value); 
return Value ， 


initialValue () 就 是 之 前 提 到 的 提供 初始 值 的 方法 ， 默 认 实 现 就 
是 返回 null 。 


remove 方 法 的 代码 也 很 直接 ， 如 下 所 示 : 


public void remove() { 
ThreadLocalMap m = getMap(Thread.currentThread( )); 
if(m != null) 
m.remove(this); 


简单 总 结 下 ， 每 个 线程 都 有 一 个 Map， 对 于 每 个 ThreadLocal 对 
象 ， 调 用 其 getset 实 际 上 束 是 以 ThreadLocal 对 象 为 键 读 写 当前 线程 的 
Map， 这 样 ， 丈 实现 了 每 个 线程 都 有 目 己 的 独立 副本 的 效果 。 

本 章 介 绍 了 Java 并 发 包 中 的 一 些 同 步 协 作 工 具 : 


1) 在 读 多 写 少 的 场景 中 使 用 ReentrantReadWriteLock 替 代 
ReentrantLock， 以 提高 性 能 。 


2) 使 用 Semaphore 限 制 对 资源 的 并 发 访问 数 。 
3) 使 用 CountDownLatch 实 现 不 同 角 色 线 程 间 的 同步 。 
4) 使 用 CyclicBarrier 实 现 同一 角色 线程 间 的 协调 一 致 。 


关于 ThreadLocal， 本 章 介绍 了 它 的 基本 概念 、 用 法 用 途 和 实现 原 
理 ， 简单 总 结 来 说 : 


1) ThreadLocal 使 得 每 个 线程 对 同一 个 变量 有 自己 的 独立 副本 ， 
征 实 现 线程 安 人 全、 减少 竞争 的 一 种 方案 。 


2) ThreadLocal 经 常用 于 存储 上 下 文 信息 ， 避 免 在 不 同 代 码 间 来 
回 传递 ， 人 冰 化 代码 。 


3) 每 个 线程 都 有 一 个 Map， 调 用 ThreadLocal 对 象 的 get/set 实 际 就 
是 以 ThreadLocal 对 象 为 键 读 写 当 前 线程 的 该 Map。 


至 此 ， 关 于 并 发 融 介 绍 完了 ， 下 一 章 ， 让 我 们 一 起 回顾 总 结 一 


第 20 草 ”并 发 尽 结 

从 第 15 章 到 第 19 章 ， 我 们 一 直 在 讨论 并 发 ， 本 章 进 行 简 要 总 结 。 
多 线程 开发 有 两 个 核心 问题 : 一 个 是 竞争 ， 另 一 个 是 协作 。 竞 争 会 出 
现 线程 安全 问题 ， 所 以 ， 本 章 首先 总 结 线程 安全 的 机 制 ， 然 后 是 协作 
的 机 制 。 管 理 竞争 和 协作 是 复杂 的 ， i 次 的 服 
人 我 们 也 会 进行 总 结 。 本 章 
级 中 


-线程 安全 的 机 制 ; 
-线程 的 协作 机 制 ; 
容 禹 类 ; 

位 


钱 
“任务 执行 服务 。 


20.1 ”线程 安全 的 机 制 


线程 表示 一 条 单独 的 执行 流 ， 每 个 线程 有 目 己 的 执行 计数 絮 ， 有 
目 己 的 栈 ， 但 可 以 共享 内 存 ， 共 享 内 存 是 实现 线程 协作 的 基础 ， 但 共 
享 内 存 有 两 个 问题 ， 竞 态 条 件 和 内 存 可 见 性 ， 之 前 章节 探讨 了 解决 这 
些 问 题 的 多 种 思路 : 

.使 用 synchronized; 

.使 用 显 式 锁 ; 

.使 用 volatile; 

使 用 原子 变量 和 CAS; 

. 写 时 复制 ; 

.使 用 ThreadLocal 。 


(1) synchronized 


synchronized 人 簿 单 易 用 ， 它 只 是 一 个 关键 字 ， 大 部 分 情况 下 ， 放 到 
类 的 方法 声明 上 区 可 以 了 ， 既 可 以 解决 竞 态 条 件 问 题 ， 也 可 以 解决 内 
存 可 见 性 问题 。 


需要 理解 的 是 ， 它 保护 的 是 对 象 ， 而 不 是 代码 ， 只 有 对 同一 个 对 
象 的 Synchronized 方 法 调用 ，synchronized 才 能 保证 它们 被 顺序 调用 。 
对 于 实例 方法 ， 这 个 对 象 是 this;， 对 于 静态 方法 ， 这 个 对 象 是 类 对 象 ; 
对 于 代码 块 ， 需 要 指定 哪个 对 象 。 

另外 ， 需 要 注意 ， 它 不 能 尝试 获取 锁 ， 也 不 啊 应 中 断 ， 还 可 能 会 
死 锁 。 不 过 ， 相 比 显 式 锁 ，synchronized 人 简单 易 用 ，JVM 也 可 以 不 断 优 
化 它 的 实现 ， 应 该 被 优先 使 用 。 


(2) 显 式 锁 


显 式 锁定 相对 于 synchronized 隐 式 训 而 言 的 ， 它 可 以 实现 
synchronized 同 样 的 功能 ， 但 需要 程序 员 上 自己 创建 锁 ， 调 用 锁 相关 的 接 
口 ， 主 要 接口 是 Lock， 主 要 实现 类 是 Reen-trantLock。 


相 比 synchronized， 显 式 锁 文 持 以 非 阻塞 方式 获取 锁 ， 可 以 啊 应 中 
和 新 ， 可 以 限时 ， 可 以 指定 公平 性 ， 可 以 解决 死 锁 问 题 ， 这 使 得 它 灵 活 


多 。 


下 


站 


在读 多 Ss 读 操 作 可 以 完全 并 行 的 场景 中 ， 可 以 使 用 读 写 锁 以 
提高 并 发 度 ， 读 写 锁 的 接口 是 ReadWriteLock， 实 现 类 是 
ReentrantRead WriteLock ° 


(3) volatile 


synchronized 和 显 式 锁 都 是 锁 ， 使 用 锁 可 以 实现 安全 ， 但 使 用 锁 是 
有 成 本 的 ， 获 取 不 到 锁 的 线程 还 需要 等 待 ， 会 有 线程 的 上 下 文 切换 开 
销 等 。 保 证 安全 不 一 定 需 要 锁 。 如 果 共 享 的 对 象 只 有 一 个 ， 操 作 也 只 
是 进行 最 简单 的 get/set 操 作 ，set 也 不 依赖 于 之 前 的 值 ， 那 束 不 存在 竞 
态 条 件 问 题 ， 而 只 有 内 存 可 见 性 问题 ， 这 时 ， 在 变量 的 声明 上 加 上 
volatile 就 可 以 了 。 


(4) 原子 变量 和 CAS 


使 用 volatile，set 的 新 值 不 能 依赖 于 旧 值 ， 但 很 多 时 候 ，set 的 新 值 
与 原来 的 值 有 关 ， 这 时 ， 也 不 一 定 需要 锁 ， 如 采 需 要 同步 的 代码 比较 
简单 ， 可 以 考虑 原子 变量 ， 它 们 包含 了 一 些 以 原子 方式 实现 组 合 操 作 
I ` 产生 序列 号 等 需求 ， 考 上 处 使 用 原子 
变量 而 非 锁 。 


原子 变量 的 基础 是 CAS， 一 般 的 计算 机 系统 都 在 硬件 层次 上 直接 
文 持 CAS 指 令 。 通 过 循环 CAS 的 方式 实现 原子 更 新 是 一 种 重要 的 思 
维 。 相 比 synchronized， 它 是 乐观 的 ， 而 synchronized 是 悲观 的 ， 它 是 
非 阻塞 式 的 ， 而 synchronized 是 阻塞 式 的 。CAS 是 Java 并 发 包 的 基础 ， 
基于 它 可 以 实现 高 效 的 、 乐 观 、 非 阻塞 式 数 据 结构 和 算法 ， 它 也 是 并 
发 包 中 锁 、 同 步 工具 和 各 种 容 右 的 基础 。 


(5) 写 时 复制 


之 所 以 会 有 线程 安全 的 问题 ， 征 因为 多 个 线程 并 发 读 写 同一 个 对 
象 ， 如 采 每 个 线程 读 写 的 对 象 都 是 不 同 的， 或 者 ， 如 采 共 孚 访问 的 对 
象 是 只 读 的 ， 不 能 修改 ， 那 也 束 不 存在 线程 安全 问题 了 。 


我 们 在 介绍 容 句 人 
时 介 \ 绍 了 写 时 复制 技术 ; 写 时 复制 就 是 将 共 至 访问 的 对 象 变 为 只 
的 ， 写 的 时 候 ， 再 使 用 锁 ， 保 证 只 有 一 个 线程 写 ， 写 的 线程 不 是 直接 
修改 原 对 象 ， 而 是 新 创建 一 个 对 象 ， 对 该 对 象 修改 完毕 后 ， 再 原子 性 
地 修改 共 至 访问 的 变量 ， 让 它 指 癌 新 的 对 象 。 


(6) ThreadLocal 
ThreadLocal 就 是 让 每 个 线程 ， 对 同一 个 变量 ， 都 有 目 己 的 独 有 副 


人 问 的 对 象 都 征 目 己 的 ， 目 然 也 束 不 存在 线程 安全 
问题 了 。 


20.2 ”线程 的 协作 机 制 


多 线程 之 间 的 核心 问题 ， 除 了 竞争 ， 束 是 协作 。 我 们 在 15.3 市 介 
绍 了 多 种 协作 场景 ， 比 如 生产 者 /消费 者 协作 模式 、 主 从 协作 模式 、 同 
时 开始 、 集 合 点 等 。 之 前 莫 节 探讨 了 协作 的 多 种 机 制 : 


“wait/notify; 

六条 件 ; 

线程 的 中 断 ; 

协作 工具 类 ; 

.阻塞 队列 

-Future/FutureTask。 
(1) wait/notify 


wait/notify 与 synchronized 配 合 一 起 使 用 ， 是 线程 的 基本 协作 机 
制 。 每 个 对 象 都 有 一 把 锁 和 两 个 等 得 队列 ， 一 个 是 锁 等 待 队 列 ， 放 的 
是 等 待 获取 锁 的 线程 ;， 另 一 个 是 条 件 等 竺 队列 ， 放 的 是 等 竺 条件 的 线 
程 ，wait 将 自己 加 入 条 件 等 每 队列 ，notify 从 条 件 等 待 队 列 上 移 除 一 个 
线程 并 唤醒 ，notifyAll 移 除 所 有 线程 并 唤醒 。 


需要 注意 的 是 ，wait/notify 方 法 只 能 在 synchronized 代 码 块 内 被 调 
用 ， 调 用 wait 时 ， 线 程 会 释放 对 象 锁 ， 被 notifynotifyAl 唤 醒 后 ， 要 重 
新 竞争 对 象 锁 ， 获 取 到 锁 后 才 会 从 wait 调 用 中 返回 ， 返 回 后 ， 不 代表 
其 等 待 的 条 件 束 一 定 成 立 了 ， 需 要 重新 检查 其 等 待 的 条 件 。 


wait/notify 方 法 看 上 去 很 简单 ， 但 往往 难以 理解 wait 等 的 到 撒 是 什 
么 ， 而 notify 通 知 的 又 是 什么 ， 只 能 有 一 个 条 件 等 竺 队列， 这 也 是 
wait/notify 机 制 的 局 限 性 ， 这 使 得 对 于 等 待 条 件 的 分 析 变 得 复杂 ，15.3 
节 通 过 多 个 例子 演示 了 其 用 法 ， 这 里 就 不 资 述 了 。 


(2) 显 式 条 件 


显 式 条 件 与 显 式 锁 配 合 使 用 ， 与 waitnotify 相 比 ， 可 以 文 持 多 个 条 
件 队列 ， 代 码 更 为 易 读 ， 歼 率 更 高 。 使 用 时 注意 不 要 将 signal/signalAll 
误 写 为 notify/notifyAll 。 


(3) 线程 的 中 断 


Java 中 取消 /关闭 一 个 线程 的 方式 是 中 断 。 中 断 并 不 是 强迫 终止 一 
个 线程 ， 它 是 一 种 协作 机 制 ， 是 给 线程 传递 一 个 取消 信号 ， 但 是 由 线 
程 来 决定 如 何以 及 何 时 退出 ， 线 程 在 不 同 状态 和 IO 操作 时 对 中 断 有 不 
同 的 反应 。 作 为 线程 的 实现 者 ， 应 该 提供 明确 的 取消 /关闭 方法 ， 并 用 
文档 清楚 描述 其 行为 ， 作 为 线程 的 调用 者 ， 应 该 使 用 其 取消 /关闭 方 
法 ， 而 不 是 贸然 调用 interrupt。 


(4) 协作 工具 类 


除了 基本 的 显 式 锁 和 和 条件， 针对 常见 的 协作 场景 ，Java 并 发 包 所 
供 了 多 个 用 于 协作 的 工具 类 。 


信号 量 类 Semaphore 用 于 限制 对 资源 的 并 发 访问 数 。 


倒计时 门 栓 CountDownLatch 主 要 用 于 不 同 角 色 线 程 间 的 同步 ， 比 
如 在 裁判 /运动 员 模 式 中 ， 裁 判 线程 让 多 个 运动 员 线 程 同 时 开始 ， 也 可 
以 用 于 协调 主 从 线程 ， 让 主线 程 等 待 多 个 从 线程 的 结果 。 


循环 栅栏 CyclicBarrier 用 于 同一 角色 线程 间 的 协调 一 致 ， 所 有 线程 
在 到 达 栅 栏 后 都 需要 等 待 其 他 线程 ， 等 所 有 线程 都 到 达 后 再 一 起 通 
过 ， 它 是 循环 的 ， 可 以 用 作 重 复 的 同步 。 


(5) 阻塞 队列 


对 于 最 常见 的 生产 者 /消费 者 协作 模式 ， 可 以 使 用 阻塞 队列 ， 阻 压 
队列 封 流 了 锁 和 和 条件， 生产 者 线程 和 消费 者 线程 只 需要 调用 队列 的 入 
队 / 出 队 方法 束 可 以 了 ， 不 需要 考虑 同步 和 协作 问题 。 


阻塞 队列 有 普通 的 先进 先 出 队列 ， 包 括 基 于 数组 的 
ArrayBlockingQueue 和 基于 链表 的 
LinkedBlockingQueue/LinkedBlockingDeque， 也 有 基于 堆 的 优先 级 阻塞 
队列 PriorityBlock-ingQueue， 还 有 可 用 于 定时 任务 的 延 时 阻塞 队列 


DelayQueue， 以 及 用 于 特殊 场景 的 阻塞 队列 SynchronousQueue 和 


LinkedTransferQueue ° 
(6) Future/FutureTask 


在 常见 的 主 从 协作 模式 中 ， 主 线程 往往 是 让 子 线程 异步 执行 一 项 
任务 ， 获 取 其 结果 。 手 工 创 建 子 线程 的 写法 往往 比较 麻烦 ， 常 见 的 模 
式 是 使 用 异步 任务 执行 服务 ， 不 再 手工 创建 线程 ， 而 只 是 提交 任务 ， 
提交 后 马上 得 到 一 个 结果 ， 但 这 个 结果 不 是 最 终结 果 ， 而 是 一 个 
Future。EFuture 是 一 个 接口 ， 主 要 实现 类 是 FutureTask。 


Future 封 装 了 主线 程 和 执行 线程 天 于 执行 状态 和 结 采 的 同步 ， 对 


于 主线 程 而 言 ， 它 只 需要 通过 Future 就 可 以 查询 异步 任务 的 状态 、 获 
取 最 终结 采 、 取 消 任务 等 ， 不 需要 再 考虑 同步 和 协作 问题 。 


20.3 . 容 宙 于 


线程 安全 的 容器 有 两 类 ， 一 类 是 同步 容器 ， 另 一 类 是 并 发 容器 。 
在 15.2 节 ， 我 们 介绍 了 同步 容器 。 关 于 并 发 容器 ， 我 们 介绍 了 : 


. 写 时 复制 的 List 和 Set 。 


‘ConcurrentHashMap ° 
:基于 SkipList 的 Map 和 Set 。 
-各 种 队列 。 
(1) 同步 容器 
Collections 类 中 有 一 些 静 态 方法 ， 可 以 基于 普通 容 絮 返回 线程 安 
全 的 同步 容器 ， 比 如 : 


public static <T> Collection<T> synchronizedCollection(Collection<T> c) 
public static <T> List<T> synchronizedList(List<T> list) 
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) 


它们 是 给 所 有 容 需 方法 都 加 上 synchronized 来 实现 安全 的 。 同 步 容 
局 的 性 能 比较 低 ， 另 外 ， 还 需要 注意 一 些 问 题 ， 比 如 复合 操作 和 和 迭 
代 ， 需 要 调用 方 手工 使 用 synchronized 同 步 ， 并 注意 不 要 同步 错 对 象 。 


”而 并 发 容 右 是 专 为 并 发 而 设计 的 ， 线 程 安全 、 并 发 度 更 高 、 性 能 
更 高 、 迭 代 不 会 抛 出 ConcurrentModificationException、 很 多 容 需 以 原 
子 方式 文 持 一 些 复 合 操作 。 

(2) 写 时 复制 的 List 和 Set 
CopyOnWriteArrayList 基 于 数组 实现 了 List 接 口 ， 


CopyOnWriteArraySet 基 于 CopyOn-WriteArrayList 实 现 了 Set 接 口 ， 它 们 
采用 了 写 时 复制 ， 适 用 于 读 远 多 于 写 ， 集 合 不 太 大 的 场合 。 不 适用 于 


数组 很 大 且 修 改 频 和 区 的 场景 。 它 们 是 以 优化 读 操 作为 目标 的 ， 读 不 需 
要 同步 ， 性 能 很 高 ， 但 在 优化 读 的 同时 牺牲 了 写 的 性 能 。 


(3) ConcurrentHashMap 


HashMap 不 是 线程 安全 的 ， 在 并 发 更 新 的 情况 下 ，HashMap 的 链 
表 结 构 可 能 形成 环 ， 出 现 死 循环 ， 占 满 CPU。ConcurrentHashMap 是 并 
发 版 的 HashMap， 通 过 细 粒 度 锁 和 其 他 技术 实现 了 高 并 发 ， 读 操作 完 
全 并 行 ， 写 操作 文 持 一 定 程度 的 并 行 ， 以 原子 方式 文 持 一 些 复 合 操 
作 ， 友 代 不 用 加 锁 ， 不 会 抛 出 ConcurrentModificationException 。 


(4) 基于 SkipList 的 Map 和 Set 


ConcurrentHashMap 不 能 排序 ， 容 辟 类 中 可 以 排序 的 Map 和 Set 是 
TreeMap 和 TreeSet， 但 它们 不 是 线程 安全 的 。Java 并 发 包 中 与 
TreeMap/TreeSet 对 应 的 并 发 版 本 是 Concurrent-SkipListMap 和 
ConcurrentSkipListSet。ConcurrentSkipListMap 是 基于 SkipList 实 现 的 ， 
Skip-List 称 为 跳跃 表 或 路 表 ， 有 是 一 种 数据 结构 ， 主 要 操作 复杂 度 为 O 

log2 (N) ) 。 并 发 版 本 采用 跳 表 而 不 是 树 ， 是 因为 跳 表 更 易于 实现 
高 效 并 发 算法 。 


ConcurrentSkipListMap 没 有 使 用 锁 ， 所 有 操作 都 是 无 阻塞 的 ， 所 
有 操作 都 可 以 并 行 ， 包 括 写 。 与 ConcurrentHashMap 类 似 ， 送 代 器 不 会 
抛 出 ConcurrentModificationException， 是 弱 一 致 的 ， 也 直接 文 持 一 些 
原子 复合 操作 。 


(5) 各 种 队列 


各 种 阻塞 队列 主要 用 于 协作 ， 非 阻塞 队列 适用 于 多 个 线程 并 发 使 
用 一 个 队列 的 场合 ， 有 两 个 非 阻塞 队 列 : ConcurrentLinkedQueue 和 
ConcurrentLinkedDeque。Concurrent-LinkedQueue 实 现 了 Queue 接 口 ， 
表示 一 个 先进 先 出 的 队列 ; ConcurrentLinkedDeque 实 现 了 Deque 接 
口 ， 表 示 一 个 双 端 队列 。 它 们 都 是 基于 链表 实现 的 ， 都 没有 限制 大 
是 无 界 的 ， 这 两 个 类 最 基础 的 实现 原理 是 循环 CAS， 没 有 使 用 
内“ 


20.4 ”任务 执行 服务 


关于 任务 执行 服务 ， 我 们 介绍 了 : 

.任务 执行 服务 的 基本 概念 。 

.主要 实现 方式 : 线程 池 。 

.定时 任务 。 

(1) 基本 概念 

任务 执行 服务 大 大 简化 了 执行 异步 任务 所 需 的 开发 ， 它 引入 了 一 
个 “执行 服务 ”的 概念 ， 将 “任务 的 提交 ”和 “任务 的 执行 ? 相 分 离 ，“ 执 行 
服务 ?封装 了 任务 执行 的 细节 ， 对 于 任务 提交 者 而 言 ， 它 可 以 关注 于 任 
务 本 身 ， 如 提交 任务 、 获 取 结 果 、 取 消 任 务 ， 而 不 需要 关注 任务 执行 
的 细节 ， 如 线程 创建 、 任 务 调度 、 线 程 关闭 等 。 

任务 执行 服务 主要 涉及 以 下 接口 : 


.Runnable 和 Callable: 表示 要 执行 的 异步 任务 。 


.Executor 和 ExecutorService: 表示 执行 服务 。 


-Future: 表示 异步 任务 的 结 采 。 


使 用 者 只 需要 通过 ExecutorService 提 交 任 务 ， 通 过 Future 操 作 任 务 
和 结果 即 可 ， 不 需要 关注 线程 创建 和 协调 的 细节 。 


(2) 线程 池 


任务 执行 服务 的 主要 实现 机 制 是 线程 池 ， 实 现 类 是 
ThreadPoolExecutor。 线程 池 主 要 由 两 个 概念 组 成 : 一 个 是 任务 队列 ; 
另 一 个 是 工作 者 线程 。 任 务 队 列 是 一 个 阻塞 队列 ， 保 存 待 执行 的 任 
务 。 工 作者 线程 主体 就 是 一 个 循环 ， 循 环 从 队列 中 接收 任务 并 执行 。 
ThreadPool-Executor 有 一 些 重要 的 参数 ， 理 解 这 些 参数 对 于 合理 使 用 
线程 池 非 常 重要 ，18.2 世 对 这 些 参数 进行 了 详细 介绍 。 


ThreadPoolExecutor 实 现 了 生产 者 /消费 者 模式 ， 工 作者 线程 就 是 
消费 者 ， 任 务 提交 者 就 是 生产 者 ， 线 程 池上 自己 维护 任务 队列 。 当 我 们 
位 到 类 似 生 产 者 /消费 者 问题 时 ， 应 该 优先 考虑 直接 使 用 线程 池 ， 而 
非 “ 重 新 发 明 轮 子 ”"， 自 己 管理 和 维护 消费 者 线程 及 任务 队列 。 

(3) 定时 任务 


异步 任务 中 ， 般 见 的 任务 是 定时 任务 。 在 Java 中 ， 有 两 种 方式 实 
现 定时 任务 : 


1) 使 用 java.util 包 中 的 Timer 和 TimerTask。 


2) 使 用 Java 并 发 包 中 的 ScheduledExecutorService 。 
Timer 有 一 些 需 要 特别 注意 的 事项 : 


1) 一 个 Timer 对 象 背 后 只 有 一 个 Timer 线 程 ， 这 意味 着 ， 定 时 任务 
不 能 耗 时 太 长 ， 更 不 能 是 无 限 循环 。 


2) 在 执行 任何 一 个 任务 的 run 方 法 时 ， 一 旦 run 抛 出 异常 ，Timer 
线程 束 会 退出 ， 从 而 所 有 定时 任务 都 会 被 取消 。 


ScheduledExecutorService 的 主要 实现 类 是 
ScheduledThreadPoolExecutor， 它 没有 Timer 的 问题 。 


1) 它 的 背后 是 线程 池 ， 可 以 有 多 个 线程 执行 任务 。 


2) 任务 执行 线程 会 捕获 任务 执行 过 程 中 的 所 有 异常 ， 一 个 定时 任 
务 的 异常 不 会 影响 其 他 定时 任务 。 

所 以 ， 实 践 中 建议 使 用 ScheduledExecutorService。 

针对 多 线程 开发 的 两 个 核心 问题 ， 竞 争 和 协作 ， 本 章 总 结 了 线程 
安全 和 协作 的 多 种 机 制 ， 针 对 高 层 服 务 ， 本 章 总 结 了 并 发 容器 和 任务 
执行 服务 ， 它 们 让 我 们 在 更 高 的 层次 上 访问 共享 的 数据 结构 ， 执 行 任 
务 ， 而 避免 陷入 线程 管理 的 细节 。 


有 一 些 并 发 的 内 容 ， 我 们 没有 讨论 ， 比 如 以 下 内 容 。 


1) Java 7 引入 的 Fork/Join 框 架 ，Java 8 中 有 并 行 流 的 概念 ， 可 以 让 
开发 者 非常 方便 地 对 大 量 数据 进行 并 行 操 作 ， 背 后 基于 的 就 是 
Fork/Join 框 架 ， 关 于 流 我 们 在 第 26 间 会 进一步 介绍 。 


2) CompletionService， 在 异步 任务 程序 中 ， 一 种 场景 是 : 主线 程 
提交 多 个 异步 任务 ， 然 后 希望 有 任务 完成 就 处 理 结果 ， 并 且 按 任务 完 
成 顺序 逐个 处 理 ， 对 于 这 种 场景 ，Java 并 发 包 提供 了 一 个 方便 的 方 
法 ， 那 就 是 使 用 CompletionService。 这 是 一 个 接口 ， 它 的 实现 类 是 
ExecutorCompletionService， 它 通过 一 个 额外 的 结果 队列 ， 方 便 了 对 于 
0 细 廊 可 参考 微 信 公众 号 “ 老 马 说 编程 ”第 79 
丽人 时” 


3) Java 83| 入 组 合式 异步 编程 CompletableFuture， 它 可 以 方便 地 
将 多 个 有 一 定 依赖 天 系 的 异步 任务 以 流水 线 的 方式 组 合 在 一 起 ， 上 自然 
地 表达 任务 之 间 的 依赖 和 关系 和 执行 流程 ， 大 大 简化 代码 ， 提 高 可 读 
性 。 关 于 CompletableFuture， 我 们 也 到 第 26 章 介绍 。 


从 下 一 章 开 始 ， 我 们 来 探讨 Java 中 的 一 些 动态 特性 ， 比 如 反射 、 
注解 、 动 态 代 理 等 ， 它 们 到 搬 是 什么 呢 ? 


利 六 部 分 “动态 与 函数 式 编程 
.第 21 章 ”反射 
第 22 章 ”注解 
:第 23 章 ”动态 代理 
第 24 章 ”类 加 载 机 制 
第 25 革 ”正则 表达 式 
-第 26 章 “函数 式 编程 


第 21 章 ”反射 


从 本 章 开 始 ， 我 们 来 探讨 Java 中 的 一 些 动态 特性 ， 包 括 反 射 、 注 
解 、 动 态 代 理 、 类 加 载 器 等 。 利 用 这 些 特 性 ， 可 以 优雅 地 实现 一 些 灵 
活 通 用 的 功能 ， 它 们 经 常用 于 各 种 框架 、 库 和 系统 程序 中 ， 比 如 : 


1) 14.5 节 介绍 的 Jackson， 利 用 反射 和 注解 实现 了 通用 的 序列 化 机 
| 区 


2) 有 多 种 库 (如 Spring MVC、Jersey) 用 于 处 理 Web 请 求 ， 利 用 
反射 和 注解 ， 能 方便 地 将 用 户 的 请 求 参 数 和 内 容 转 换 为 Java 对 象 ， 将 
Java 对 象 转变 为 啊 应 内 容 。 


3) 有 多 种 库 (如 Spring、Guice) 利用 这 些 特 性 实现 了 对 象 管理 
容 右 ， 方 便 程序 员 管 理 对 象 的 生命 周期 以 及 其 中 复杂 的 依赖 关系 。 


4) 应 用 服务 器 (如 Tomcat) 利用 类 加 载 右 实现 不 同 应 用 之 间 的 隔 
离 ，JSP 技 术 利用 类 加 载 器 实现 修改 代码 不 用 重 局 残 能 生殖 的 特性 。 

5) 面向 方面 的 编程 AOP (Aspect Oriented Programming) 将 编程 
中 通用 的 关注 点 (如 日 志 记 录 、 安 全 检查 等 ) 与 业务 的 主体 逻辑 相 分 
离 ， 减 少见 余 代码 ， 提 高 程序 的 可 维护 性 ，AOP 需 要 依赖 上 面 的 这 些 
特性 来 实现 。 

本 章 主要 介绍 反射 机 制 ， 后 续 章 下 介绍 其 他 内 容 。 


攻 在 一 般 操 作 数 据 的 时 候 ， 我 们 都 是 知道 并 且 依 赖 于 数据 类 型 的 ， 
比如 : 


1) 根据 类 型 使 用 new 创 建 对 象 。 

2) 根据 类 型 定义 变量 ， 类 型 可 能 是 基本 类 型 、 类 、 接 口 或 数组 。 
3) 将 特定 类 型 的 对 象 传递 给 方法 。 

4) 根据 类 型 访问 对 象 的 属性 ， 调 用 对 象 的 方法 。 


编译 需 也 是 根据 类 型 进行 代码 的 检查 编译 的 。 


反射 不 一 样 ， 它 是 在 运行 时 ， 而 非 编译 时 ， 动 仿 获取 类 型 的 信 
思 ， 比 如 接口 信息 、 成 员 信息 、 方 法 信息 、 构 造 方法 信息 等 ， 根 据 这 
些 动态 获取 到 的 信息 创建 对 象 、 访 问 /修改 成 员 、 调 用 方法 等 。 这么 说 
比较 抽象 ， 下 面 我 们 会 具体 说 明 。 反 射 的 入 口 是 名 称 为 Class 的 类 ， 我 
们 先 介绍 Class 类 ， 随 后 举例 说 明 反 射 的 应 用 ， 接 着 讨论 反射 与 沁 型 ， 


最 后 进行 总 结 。 


21.1 “Class 类 


在 介绍 类 和 继承 的 实现 原理 时 ， 我 们 提 到 ， 每 个 已 加 载 的 类 在 内 
存 都 有 一 份 类 信息 ， 每 个 对 象 都 有 指向 它 所 属 类 信息 的 引用 。Java 中 ， 
类 信息 对 应 的 类 就 是 java.lang.Class。 注 意 不 是 小 写 的 class，class 是 定 
。 所 有 类 的 根 父 类 Object 有 一 个 方法 ， 可 以 获取 对 象 的 
Class 对 和 家: 


public final native Class<?> getClass() 


Class 是 一 个 泛 型 类 ， 有 一 个 类 型 参数 ，getClass () 并 不 知道 具体 
的 类 型 ， 所 以 返回 Class<? >。 


获取 Class 对 象 不 一 定 需 要 实例 对 象 ， 如 果 在 写 程序 时 就 知道 类 
名 ， 可 以 使 用 < 类 名 >.class 获 取 Class 对 象 ， 比 如 : 


Class<Date> cls = Date.class; 


接口 也 有 Class 对 象 ， 且 这 种 方式 对 于 接口 也 是 适用 的 ， 比 如 : 


Class<Comparable> cls = Comparable.class,; 


基本 类 型 没有 getClass 方 法 ， 但 也 都 有 对 应 的 Class 对 象 ， 类 型 参数 
为 对 应 的 包装 类 型 ， 比 如: 


Class<Integer> intCls = int.class,; 
Class<Byte> byteCls = byte.class,; 
Class<Character> charcls = char.class; 
Class<Double> doubleCls = double.class; 


void 作为 特殊 的 返回 类 型 ， 也 有 对 应 的 Class: 


Class<Void> voidCcls = void,.class; 


对 于 数组 ， 每 种 类 型 都 有 对 应 数组 类 型 的 Class 对 象 ， 每 个 维度 都 
有 一 个 ， 即 一 维 数组 有 一 个 ， 二 维 数 组 有 一 个 不 同 的 类 型 。 比 如 : 


String[] strArr = new String[10]; 

int[][] twoDimArr = new int[3][2]; 

int[] oneDimArr = new int[10]; 

Class<? extends String[]> strArrCls = strArr.getclass(); 
Class<? extends int[][]> twoDimArrCls = twoDimArr ,getClass()， 
Class<? extends int[]> oneDimArrCls = oneDimArr .getClass()， 


枚 举 类 型 也 有 对 应 的 Class， 比 如 : 


enum Size { 
SMALL， MEDIUM， BIG 


Class 有 一 个 静态 方法 forName， 可 以 根据 类 名 直接 加 载 Class， 
取 Class 对 象 ， 比 如 : 


try { 
Class<?> cls = Class.forName("java.util.HashMap"); 
System.out.printin(cls.getName()); 

} catch (ClassNotFoundException e) { 
e.printSstackTrace( ); 

和 


注意 forName 可 能 抛 出 异常 ClassNotFoundException 。 


有 了 Class 对 象 后 ， 我 们 就 可 以 了 解 到 关于 类 型 的 很 多 信息 ， 并 基 
于 这 些 信息 采取 一 些 行动 。 Class 的 方法 很 多 ， 大 部 分 比较 人 简单 直接 ， 
容易 理解 下 面 ， 我 们 分 为 看 干 组 ， 包 括 名 称 信息 、 字 段 信息 、 方 法 
言 息 、 创 建 对 象 和 构造 方法 、 类 型 信息 等 ， 进 行人 简要 介绍 。 


1. 名 称 信息 
Class 有 如 下 方法 ， 可 以 获取 与 名 称 有 关 的 信息 : 


public String getName() 

public String getSimpleName() 
public String getCanonicalName() 
public Package getPackage() 


getSimpleName 返 回 的 名 称 不 带 包 信 息 ，getName 返 回 的 是 Java 内 部 
使 用 的 真正 的 名 称 ，getCanonicalName 返 回 的 名 称 更 为 友好 ， 
getPackage 返 回 的 是 包 信 息 ， 它 们 的 不 同 如 表格 21-1 所 示 。 


表 21-1 不 同 Class 对 象 的 各 种 名 称 方法 的 返回 值 


int.class int null 
int[].class int[] null 
Java.lang.String Java.lang 
Java.lang.String[] null 
HashMap.class Java.util.HashMap Java.util 


需要 说 明 的 是 数组 类 型 的 getName 返 回 值 ， 它 使 用 前 级 [表示 数 
组 ， 有 几 个 [表示 是 几 维 数组 ， 数 组 的 类 型 用 一 个 字符 表示 ，I 表 示 int， 
L 表 示 类 或 接口 ， 其 他 类 型 与 字符 的 对 应 关系 为 : boolean (Z) 、byte 
(B) ~char (C) 、double (D) 、float (F) ~long (J) 、short 
(S) 。 对 于 引用 类 型 的 数组 ， 注 意 最 后 有 一 个 分 号 ; 。 


2. 字 段 信 息 
类 中 定义 的 静态 和 实例 变量 都 被 称 为 字段 ， 用 类 Field 表 示 ， 位 于 


包 java.lang.reflect 下 ， 后 文 涉及 的 反射 相关 的 类 都 位 于 该 包 下 。Class 有 
4 个 获取 字段 信息 的 方法 : 


String.class 


String[].class 


六 


// 返 回 所 有 的 pub1ic 字 段 ， 包 括 其 父 类 的 ， 如 果 没 有 字段 ， 返 回 空 数组 

public Field[] getFields() 

// 返 回 本 类 声明 的 所 有 字段 ， 包 括 非 public 的 ， 但 不 包括 父 类 的 

public Field[] getDeclaredFields() 

// 返 回 本 类 或 父 类 中 指定 名 称 的 public 字 段 ， 找 不 到 抛 出 异常 NoSuchFieldException 
public Field getField(String name) 

// 返 回 本 类 中 声明 的 指定 名 称 的 字段 ， 找 不 到 抛 出 异常 NoSuchFieldException 


public Field getDeclaredField(String name) 


Field 也 有 很 多 方法 ， 可 以 获取 字段 的 信息 ， 也 可 以 通过 Field 访 问 
和 操作 指定 对 象 中 该 字段 的 值 ， 基 本 方法 有 : 


// 获 取 字 段 的 名 称 

public String getName( ) 

// 判 断 当 前 程序 是 否 有 该 字段 的 访问 权限 

public boolean isAccessible() 

//flag 设 为 true 表 示 名 略 Java 的 访问 检查 机 制 ， 以 允许 读 写 非 public 的 字段 
public void setAccessible(boolean flag) 

// 获 取 指 定 对 象 obj 中 该 字段 的 值 

public Object get(Object obj ) 

// 将 指定 对 象 obj 中 该 字段 的 值 设 为 value 

public void set(Object obj, Object value) 


在 get/set 方 法 中 ， 对 于 静态 变量 ，obj 被 名 略 ， 可 以 为 null， 如 打字 
段 值 为 基本 类 型 ，get/set 会 目 动 在 基本 类 型 与 对 应 的 包装 0 行 转 
换 ， 对 于 private 字 段 ， 直 接 调用 get/set 会 抛 出 非法 访问 异 
IllegalAccessException， 应 该 先 调 用 setAccessible (true) 以 关闭 java 的 
检查 机 制 。 看 段 位 单 的 示例 代码 : 


List<String> obj = Arrays.asList(new String[]{" 老 马 ", "编程 "}); 
Class<?> cls = 0bj.getClass()， 
for(Field f : cls.getDeclaredFields()){ 
f,setAccessible(true); 
System.out.println(f.getName()+" - "+f.get(obj)); 


代码 比较 人 简单， 就 不 帝 述 了 。 除 了 以 上 方法 ，Field 还 有 很 多 其 他 
方法 ， 比 如 : 


// 返 回 字 段 的 修饰 符 

BUbLIC int getModifiers() 
// 返 回 字 段 的 类 型 
public Class<?> getType() 

// 以 基本 类 型 操作 字段 

public void setBoolean(Object obj, boolean 2z) 

public boolean getBoolean(Object obj) 

public void setDouble(Object obj, double d) 

public double getDouble(Object obj) 

// 查 询 字 段 的 注解 信息 ， 下 一 章 介绍 注解 

public <T extends Annotation> T getAnnotation(Class<T> annotationClass) 
public Annotation[] getDeclaredAnnotations() 


getModifiers 返 回 的 是 一 个 int， 可 以 通过 Modifier 类 的 静态 方法 进行 
解读 。 比 如 ， 假 定 Student 类 有 如 下 字段 : 


public static final int MAX_NAME_LEN = 255， 


可 以 这 样 查 看 该 子 段 的 修饰 符 


Field f = Student.class.getField("MAX_ NAME_LEN"); 
int mod = f.getModifiers(); 
System.out.println(Modifier.toString(mod)); 


System.out.printlin("isPpublic: " + Modifier.ispPublic(mod)); 
System.out.printin("isStatic: " + Modifier.isStatic(mod)); 
System.out.printin("isFinal: " + Modifier.isFinal(mod)); 
System.out.printlin("isVolatile: " + Modifier.isVolatile(mod)); 


输出 为 : 


public static final 
isPublic: true 
isStatic: true 
isFinal: true 
isVolatile: false 


, 方法 信 证 轧 


类 中 定义 的 静态 和 实例 方法 都 被 称 为 方法 ， 用 类 Method 表 示 。 
Class 有 如 下 相关 方法 : 


// 返 回 所 有 的 pub1ic 方 法 ， 包 括 其 父 类 的 ， 如 果 没 有 方法 ， 返 回 空 数组 

ic Method[] getMethods() 

// 返 回 本 类 声明 的 所 有 方法 ， 包 括 非 public 的 ， 但 不 包括 父 类 的 
i 


ic Method[] getDeclaredMethods() 

本 类 或 父 类 中 指定 名 称 和 参数 类 型 的 public 方 法 ， 
// 找 不 到 抛 出 异常 NoSuchMethodException 

public Method Ge name, Class<?>... parameterTypes) 

// 返 回 本 类 中 声明 的 指定 名 称 和 参数 类 型 的 方法 ， 找 不 到 抛 出 异常 NoSuchMethodException 
public Method getDeclaredMethod(String name, Class<?>... parameterTypes) 


通过 Method 可 以 获取 方法 的 信息 ， 也 可 以 通过 Method 调 用 对 象 的 
方法 ， 基 本 方法 有 : 


// 获 取 方 法 的 名 称 

public String getName( ) 

//f1ag 设 为 true 表 示 忽 略 Java 的 访问 检查 机 制 ， 以 允许 调用 非 pub1ic 的 方法 

public void setAccessible(boolean flag) 

// 在 指定 对 象 obj 上 调用 Method 代 表 的 方法 ， 具 谴 的 参数 列表 为 args 

public Object invoke(Object obj, Object... args) throws 
IllegalAccessException, Illegal-ArgumentException, InvocationTargetException 


对 invoke 方 法 ， 如 采 Method 为 静态 方法 ，obj 被 名 略 ， 可 以 为 null， 
args 可 以 为 hull， 也 可 以 为 一 个 空 .0 万 法 调用 的 返回 值 被 包 沽 为 
Object 返 回 ， 如 果实 际 方法 调用 抛 出 异 异常 被 包装 为 
InvocationTargetException 蝇 新 抛 出 ， 可 以 过 getCause 方 法 得 到 原 异 
第 。 看 段 人 简单 的 示例 : 


Class<?> cls = Integer.class,; 
try { 


Method method = cls.getMethod("parseInt", new Class[]{String.class}); 
System.out.println(method,.invoke(null, "123")); 
} catch (NoSuchMethodException e) { 
e.printstackTrace( ); 
} catch (InvocationTargetException e) { 
e.printSstackTrace( ); 


Method 下 有 很 多 方法 ， 可 以 获取 其 修饰 伯 、 参 数 、 返 回 值 、 注 解 
等 信息 ， 有 具体 束 不 列举 了 。 
4. 创 建 对 象 和 构造 方法 

Class 有 一 个 方法 ， 可 以 用 它 来 创建 对 象 : 


public T newInstance() throws InstantiationException, IllegalAccessException 


它 会 调用 类 的 默认 构造 方法 ( 即 无 参 public 构 造 方法 ) ， 如 果 类 没 
有 该 构造 方法 ， 会 抛 出 异常 InstantiationException。 看 个 简单 示例 : 


Map<String,Integer> map = HashMap.class.newInstance(); 
map.put("hello", 123); 


newInstance 只 能 使 用 默认 构造 方法 。Class 还 有 一 些 方 法 ， 可 以 获 
取 所 有 的 构造 方法 : 


// 获 取 所 有 的 pub1ic 构 造 方法 ， 返 回 值 可 能 为 长 度 为 9 的 空 数组 

public Constructor<?>[] getConstructors() 

// 获 取 所 有 的 构造 方法 ， 包 括 非 pub1ic 的 

public Constructor<?>[] getDeclaredConstructors() 

// 获 取 指 定 参数 类 型 的 pub1Lic 构 造 方法 ， 没 找到 抛 出 异常 NoSuchMethodException 

public Constructor<T> getCconstructor(Class<?>,.,，parameterTypes) 

// 获 取 指 定 参 数 类 型 的 构造 方法 ， 包 括 非 pub1lic 的 ， 没 找到 抛 出 异常 NoSuchMethodException 
public Constructor<T> getDeclaredConstructor(Class<?>... parameterTypes) 


类 Constructor 表 示 构 造 方法 ， 通 过 它 可 以 创建 对 象 ， 方 法 为 : 


public T newInstance(Object ... initargs) throws InstantiationException, 
IllegalAccessException, IllegalArgumentException, InvocationTargetException 


看 个 例子 : 


Constructor<StringBuilder> contructor= StringBuilder.class 
.getConstructor(new Class[]{int.class}); 
StringBuilder sb = contructor.newInstance(100); 


除了 创建 对 象 ，Constructor 还 有 很 多 方法 ， 可 以 获取 关于 构造 方法 
的 很 多 信息 ， 包 括 参 数 、 修 饰 行 、 注 解 等 ， 具体 就 不 列举 了 。 


5. 类 型 检查 和 转换 
我 们 之 前 介绍 过 instanceof 关 键 字 ， 它 可 以 用 来 判断 变量 指 加 的 实 


际 对 象 类 型 。instanceof 后 面 的 类 型 是 在 代码 中 确定 的 ， 如 果 要 检查 的 
类 型 是 动态 的 ， 可 以 使 用 Class 类 的 如 下 方法 : 


public native boolean isInstance(Object obj) 


也 束 是 说 ， 如 下 代码 : 


if(list instanceof ArrayList){ 
System.out.printlin("array list"),; 
了 


和 下 面 代 码 的 输出 是 相同 的 : 


Class cls = Class.forName("java.util.ArrayList"); 
if(cls.isInstance(list)){ 
System.out.printlin("array list"),; 


除了 判断 类 型 ， 在 程序 中 也 往往 需要 进行 强制 类 型 转换 ， 比 如 : 


List list = ，， 
if(list instanceof ArrayList){ 
ArrayList arrList = (ArrayList)list,; 


在 这 段 代码 中 ， 强 制 转换 到 的 类 型 是 在 写 代码 时 束 知 道 的 。 如 末 
是 动态 的 ， 可 以 使 用 Class 的 如 下 方法 : 


public T cast(Object obj) 


比如 : 


public static <T> T toType(Object obj, Class<T> cls){ 
return cls.cast(obj); 


isInstance/cast 摘 述 的 都 是 对 象 和 类 之 间 的 关系 ，Class 还 有 一 个 方 
法 ， 可 以 判断 Class 之 间 的 关系 : 


// 检 查 参数 类 型 c1s 能 否 赋 给 当前 Class 类 型 的 变量 
public native boolean isAssignableFrom(Class<?> cls); 


比如 ， 如 下 表达 式 的 结果 都 为 true: 


Object.class.isAssignableFrom(String.class) 
String.class.isAssignableFrom(String.class) 
List.class.isAssignableFrom(ArrayList.class) 


6.Class 的 类 型 信息 


class 代表 的 类 型 既 可 以 是 普通 的 类 ， 也 可 以 是 内 部 类 ， 还 可 以 是 
基本 类 型 、 数 组 等 ， 对 于 一 个 给 定 的 Class 对 象 ， 它 到 底 是 什么 类 型 
呢 ? 可 以 通过 以 下 方法 进行 检查 : 


public native boolean isArray() // 是 否 是 数组 

public native boolean isPrimitive() // 是 否 是 基本 类 型 
public native boolean isInterface() // 是 否 是 接 
public boolean isEnum() // 是 否 是 枚 举 


public boolean isAnnotation() // 是 否 是 注解 

public boolean isAnonymousClass() // 是 否 是 匿名 内 部 类 
public boolean isMemberClass() // 是 否 是 成 员 类 ， 成员 类 定义 在 方法 外 ， 不 是 匿名 类 
public boolean isLocalClass() // 是 否 是 本 地 类 ， 本 地 类 定义 在 方法 内 ， 不 是 匿名 类 


a 类 的 声 明 信 息 


Class 还 有 很 多 方法 ， 可 以 获取 类 的 声明 信息 ， 如 修饰 符 、 父 类 、 
接口 、 注 解 等 ， 如 下 所 示 : 


Pr 


// 获 取 修饰 符 ， 返回 值 可 通过 Modifier 类 进行 解读 
public native int getModifiers() 
// 获 取 父 类 ， 如 果 为 0Object， 父 类 为 null 
public native Class<? super T> getSuperclass() 
// 对 于 类 ， 为 自己 声明 实现 的 所 有 接口 ， 对 于 接口 ， 为 直接 扩展 的 接口 ， 不 包括 通过 
public native Class<?>[] getInterfaces(); 
// 自 己 声明 的 注解 
public Annotation[] getDeclaredAnnotations() 
// 所 有 的 注解 ， 包 括 继承 得 到 的 
public Annotation[] getAnnotations() 
// 获 取 或 检查 指定 类 型 的 注解 ， 包 括 继承 得 到 的 
public <A extends Annotation> A getAnnotation(Class<A> annotationClass) 
public boolean isAnnotationpresent( 

Class<? extends Annotation> annotationClass) 


~ 
bo 


类 继承 的 


8. 类 的 加 载 
Class 有 两 个 静态 方法 ， 可 以 根据 类 名 加 载 类 : 


public static Class<?> forName(String className) 
public static Class<?> forName(String name, boolean initialize, 
ClassLoader loader) 


0 第 24 章 会 进一步 介绍 ，initialize 表 示 加 
载 后 ， 是 否 执 行 类 的 初始 化 代码 (如 static 语 句 块 ) 。 第 一 个 方法 中 没 
有 传 这 文 些 参数 ， 相当 于 调用 : 


Class.forName(className, true, currentLoader) 


currentLoader 表 示 加 载 当 前 类 的 ClassLoader 。 


这 里 className 与 Class.getName 的 返回 值 是 一 致 的 。 比 如 ， 对 于 
String 数 组 : 


String name = "[Ljava.lang.String;"; 
Class cls = Class,forName(name ) ， 
System.out.println(cls == String[].class); 


需要 注意 的 是 ， 基 本 类 型 不 支持 forName 方 法 ， 也 就 是 说 ， 如 下 写 
法 


Class.forName("int"); 


会 抛 出 异常 ClassNotFoundException。 那 如 何 根 据 原始 类 型 的 字符 
串 构 造 Class 对 象 呢 ?” 可 以 对 Class.forName 进 行 一 下 包装 ， 比 如 : 


public static Class<?> forName(String className) 
throws ClassNotFoundException{ 
if("int".equals(className)){ 
return int.class; 
} 


// 其 他 基本 类 型 略 
return Class.forName(className); 


需要 说 明 的 是 ，Java 9 还 有 一 个 forName 方 法 ， 用 于 加 载 指定 模块 
中 指定 名 称 的 类 : 


public static Class<?> forName(Module module, String name) 


参数 module 表 示 模 块 ， 这 是 Java 9 引入 的 类 ， 当 找 不 到 类 的 时 候 ， 
它 不 会 抛 出 异常 ， 而 是 返回 null， 它 也 不 会 执行 类 的 初始 化 。 


9. 反 瑞 与 数组 
对 于 数组 类 型 ， 有 一 个 专门 的 方法 ， 可 以 获取 它 的 元 素 类 型 : 


public native Class<?> getComponentType() 


比如 : 


String[] arr = new String[]{}; 
System.out,.println(arr.getClass().getComponentType() )， 


输出 为 : 


class java.lang.Sstring 


java.lang.reflect 包 中 有 一 个 针对 数组 的 专门 的 类 Array (注意 不 是 
javautil 中 的 Arrays) ， 提 供 了 对 于 数组 的 一 些 反射 文 持 ， 以 便于 统一 
处 理 多 种 类 型 的 数组 ， 主 要 方法 有 : 


// 创 建 指定 元 素 类 型 、 指 定 长 度 的 数组 

public static Object newInstance(Class<?> componentType, int length) 

// 创 建 多 维 数组 

public static Object newInstance(Class<?> componentType, int... dimensions) 


// 获 取 数 组 array 指 定 的 索引 位 置 index 处 的 值 
public static native Object get(Object array, int index) 
// 修 改 数组 array 指 定 的 索引 位 置 index 处 的 值 为 value 


public static native void set(Object array, int index, Object value) 


// 返 回 数组 的 长 度 


public static native int getLength(Object array) 


需要 注 


Es 
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的 是 ， 在 Array 类 中 ， 数 组 是 用 Object 而 韭 Object[] 表 示 


的 ， 这 是 为 什么 呢 ? 这 是 为 了 方便 处 理 多 种 类 型 的 数组 。int[]、String[] 
都 不 能 与 Object[] 相 互 转换 ， 但 可 以 与 Object 相互 转换 ， 比 如 : 


int[] intArr = (int[])Array.newInstance(int.class, 10); 
String[] strArr = (String[])Array.newInstance(String.class, 10); 


除了 以 Object 类 型 操作 数组 元 素 外 ，Array 也 文 持 以 各 种 基本 类 型 
操作 数组 元 素 ， 如 : 


public 
public 
public 
public 


10. 反 味 与 枚 举 


static 
static 
static 
static 


native double getDouble(Object array, int index) 

native void setDouble(Object array, int index, double d) 
native void setLong(Object array, int index, long 1) 
native long getLong(Object array, int index) 


枚 举 类 型 也 有 一 个 专门 方法 ， 可 以 获取 所 有 的 枚 举 常 量 : 


天 -一 


public T[] getEnumConstants() 


天 


21.2 ”应 用 示例 


介绍 了 Class 的 这 么 多 方法 ， 有 什么 用 呢 ? 我 们 看 个 人 简单 的 示例 ， 
利用 反映 实 现 一 个 简单 的 通用 序列 化 / 反 序 列 化 类 SimpleMapper， 它 提 
供 两 个 静态 方法 : 


public static String toString(Object obj ) 
public static Object fromString(String str) 


toString 将 对 象 obj 转 换 为 字符 串 ，fromString 将 字符 串 转 换 为 对 
象 。 为 简单 起 见 ， 我 们 只 支持 最 简单 的 类 ， 即 有 默认 构造 方法 ， 成 员 
类 型 只 有 基本 类 型 、 包 装 类 或 String。 另 外 ， 序 列 化 的 格式 也 很 简单 ， 
第 一 行为 类 的 名 称 ， 后 面 每 行 表示 一 个 字段 ， 用 字符 '=' 分 隔 ， 表 示 字 
I ° 我 们 先 看 SimpleMapper 的 用 法 ， 如 代码 清 
21-1PT 泵 。 


代码 清单 21-1 简单 的 通用 序列 化 / 反 序列 化 类 SimpleMapper 的 使 


用 


public class SimpleMapperDemo { 
static class Student { 
String name; 
int age; 
Double score; 
// 省 略 了 构造 方法 ，getter/setter 和 toString 方 法 
} 


public static void main(String[] args) 
Student zhangsan = new Student(" 张 三 "，18，89d) 
String str = SimpleMapper.toString(zhangsan); 
Student zhangsan2 = (Student) SimpleMapper.fromString(str); 
System.out.println(zhangsan2); 


代码 先 调 用 toString 方 法 将 对 象 转换 为 了 String， 人 然后 调用 
fromString 方 法 将 字符 串 转 换 为 了 Student， 狐 对 象 的 值 与 原 对 象 是 一 样 
的 ， 输 出 如 下 所 示 : 


Student [name= 张 三 ，age=18， score=89.0] 


我 们 来 看 SimpleMapper 的 示例 实现 (主要 用 于 演示 原理 ) ， 
toString 的 代码 为 : 


public static String toString(Object obj) { 
try { 

Class<?> cls = obj.getClass(); 

StringBuilder sb = new StringBuilder(); 

sb.append(cls.getName() + "\n"); 

for(Field f : cls.getDeclaredFields()) { 

if(!f.isAccessible()) { 

f.setAccessible(true); 


} 
sb.append(f.getName() + "=" + f.get(obj).toSstring() + "\n"); 


return sb.toString(); 
} catch(IllegalAccessException e) { 
throw new RuntimeException(e); 


} 


代码 比较 简单 ， 我 们 就 不 次 述 了 。fromString 的 代码 为 : 


public static Object fromString(String str) { 
try { 
String[] lines = str.split("\n"),; 
if(lines.length < 1) { 
throw new IllegalArgumentException(str); 


Class<?> cls = Class.forName(lines[0]); 
Object obj = cls.newInstance(); 
if(lines.length > 1) { 
for(int i = 1; i < lines.length; i++) { 
String[] fv = lines[i].split("="); 
if(fv.length != 2) { 
throw new IllegalArgumentException(lines[i]); 


} 

Field f = cls.getDeclaredField(fv[0]); 

if(!f.isAccessible()){ 
f.setAccessible(true); 


} 
setFieldValue(f, obj, fv[1]); 


} 
} 
return obj; 
} catch(Exception e) { 
throw new RuntimeException(e); 


} 


它 调用 了 setFieldValue 方 法 对 字段 设置 值 ， 其 代码 为 : 


private static void setFieldValue(Field f, Object obj, String value) 
throws Exception { 
Class<?> type = f.getType(); 
if(type == int.class) { 
f.setInt(obj, Integer.parseIint(value)); 
else if(type == byte.class) { 
f.,setByte(obj, Byte.parseByte(value)); 
else if(type == short.class) { 
f.,setShort(obj, Short.parseShort(value)); 
else if(type == long.class) { 
f.setLong(obj, Long.parseLong(value)); 
else if(type == float.class) { 
f.setFloat(obj, Float.parseFloat(value)); 
else if(type == double.class) { 
f.,setDouble(obj, Double.parseDouble(value)); 
else if(type == char.class) { 
f.setchar(obj, value.charAt(0)); 
else if(type == boolean.class) { 
f.setBoolean(obj, Boolean.parseBoolean(value)); 
else if(type == String.class) { 
f.set(obj, value); 
else { 
Constructor<?> ctor = type.getConstructor( 
new Class[] { String.class }); 
f.set(obj, ctor.newInstance(value)); 


wv 


setFieldValue 根 据 字 段 的 类 型 ， 将 字符 串 形 式 的 值 转换 为 了 对 应 类 
型 的 值 ， 对 于 基本 类 型 和 String 以 外 的 类 型 ， 它 假定 该 类 型 有 一 个 以 
String 类 型 为 参数 的 构造 方法 。 


示例 的 完整 代码 在 github 上 ， 地 址 为 
https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c84 下 。 


21.3 ”反射 与 泛 型 


在 介绍 泛 型 的 时 候 ， 我 们 提 到 ， 泛 型 参数 在 运行 时 会 被 氛 除 ， 这 
里 ， 我 们 需要 补充 一 下 ， 在 类 信息 Class 中 依然 有 关于 泛 型 的 一 些 信 
息 ， 可 以 通过 反射 得 到 。 泛 型 涉及 一 些 更 多 的 方法 和 类 ， 上 面 的 介绍 
中 进行 了 忽略 ， 这 里 简要 补充 下 。 

Class 有 如 下 方法 ， 可 以 获取 类 的 泛 型 参数 信息 : 


public TypeVariable<Class<T>>[] getTypeParameters() 


Field 有 如 下 方法 : 


public Type getGenericType() 


Method 有 如 下 方法 : 


public Type getGenericReturnType() 
public Type[] getGenericPparameterTypes() 
public Type[] getGenericExceptionTypes() 


Constructor 有 如 下 方法 : 


public Type[] getGenericPparameterTypes() 


Type 是 一 个 接口 ，Class 实 现 了 Type，Type 的 其 他 子 接口 还 有 : 
"TypeVariable: 类 型 参数 ， 可 以 有 上 界 ， 比 如 Textends Number; 


ParameterizedType: 参数 化 的 类 型 ， 有 原始 类 型 和 具体 的 类 型 参 
数 /， 比如 List; 


`WildcardType: 通配符 类 型 ， 比 如 ? 、? extends Number、? 
super Integer ° 


我 们 看 一 个 简单 的 示例 ， 如 代码 清单 21-2 所 示 。 
代码 清单 21-2 ”通过 反射 获取 泛 型 信息 示例 


public class GenericDemo { 

static class GenericTest<U extends Comparable<U>, V> { 
Uu; 
Vv; 
List<String> list; 
public U test(List<? extends Number> numbers) { 

return null; 

} 

} 


public static void main(String[] args) throws Exception { 
Class<?> cls = GenericTest.class,; 
// 类 的 类 型 参数 
for(TypeVariable t : cls.getTypeParameters()) { 
System.out.println(t.getName() + " extends " + 
Arrays.toString(t.getBounds( ))); 


} 
// 字 段 : 泛 型 类 型 
Field fu = cls.getDeclaredField("u"); 
System.out.printljn(fu.getGenericType()); 
// 字 段 : 参数 化 的 类 型 
Field flist = cls.getDeclaredField("1list"),; 
Type listType = flist.getGenericType(); 
if(listType instanceof ParameterizedType) { 
ParameterizedType pType = (ParameterizedType) listType; 
System,.out,println("raw type: " + pType.getRawType() 
+ ",type arguments:" 
+ Arrays.toString(pType.getActualTypeArguments())); 


} 

// 方 法 的 泛 型 参数 

Method m = cls.getMethod("test", new Class[] { List,class }); 

for(Type t : m,getGenericParameterTypes()) { 
System.out.println(t); 

} 


程序 的 输出 为 : 


U extends [java.lang.Comparable<U>] 

V extends [class java.lang.Object] 

U 

raw type: interface java.util.List,type arguments:[class java.lang.Sstring] 
java.util.List<? extends java.lang.Number> 


代码 比较 简单 ， 我 们 下 不 资 述 了 。 


本 章 介 绍 了 Java 中 反射 相关 的 主要 类 和 方法 ， 通 过 入 口 类 Class， 
可 以 访问 类 的 各 种 信息 ， 如 字段 、 方 法 、 构 造 方 法 、 父 类 、 接 口 、 泛 
型 信息 等 ， 也 可 以 创建 和 操作 对 象 、 调 用 方法 等 ， 利 用 这 些 方法 ， 可 
以 编写 通用 的 、 动 态 灵 活 的 程序 ， 本 章 演示 了 一 个 简单 的 通用 序列 化 / 
反 序列 化 类 SimpleMapper 。 


反射 虽然 是 灵活 的 ， 但 一 般 情 况 下 ， 并 不 是 我 们 优先 建议 的 ， 主 
要 原因 是 : 

1) 反射 更 容易 出 现 运 行 时 错误 ， 使 用 显 式 的 类 和 接口 ， 编 译 器 
帮 我 们 做 类 型 检查 ， 减 少 错误 ， 但 使 用 反射 ， 类 型 芝 运行 时 才 知道 
的 ， 编 译 硕 无 能 为 力 。 


2) 反射 的 性 能 要 低 一 些 ， 在 访问 字段 、 调 用 方法 前 ， 反 射 先 要 查 
找 对 应 的 Field/Method， 要 慢 一 些 。 


简单 地 说 ， 如 采 能 用 接口 实现 同样 的 灵活 性 ， 束 不 要 使 用 反射 。 


本 章 介 绍 的 很 多 类 (如 Class、Field、Method、Constructor) 都 可 
以 有 注解 ， 注 解 到 的 是 什么 呢 ? 让 我 们 下 章 探讨 。 


第 22 章 ”注解 


前 一 章 我 们 探讨 了 反射 ， 反 射 相关 的 类 中 都 有 方法 获取 注解 信 
思 ， 我 们 在 前 面 章 节 中 也 多 次 提 到 过 注解 ， 注 解 到 撒 是 什么 呢 ? 在 
Java 中 ， 注 解 殴 是 给 程序 添加 一 些 信 息 ， 用 字符 @ 开 头 ， 这 些 信息 用 
于 修饰 它 后 面 紧 挨 着 的 其 他 代码 元 素 ， 比 如 类 、 接 口 、 了 字段 、 方 法 、 
方法 中 的 参数 、 构 造 方法 等 。 注 解 可 以 被 编译 万 、 程 序 运 行 时 和 其 他 
工具 使 用 ， 用 于 增强 或 修改 程序 行为 等 。 


这 么 说 比较 抽象 ， 下 面 我 们 会 具体 介绍 。 先 介绍 Java 的 一 些 内 置 
注解 ， 然 后 介绍 一 些 框 架 和 库 的 注解 ， 了 解 了 注解 的 使 用 之 后 ， 介 绍 
皇 么 创建 注解 ， 如 何 利用 反射 得 看 注解 信息 ， 最 后 我 们 介绍 注解 的 两 
个 应 用 : 定制 序列 化 和 依赖 注入 容器 。 


22.1 内 鞋 注 解 

Java 内 置 了 一 些 常 用 注解 : @Override、@Deprecated 、 
@SuppressWarnings， 我 们 简要 介绍 。 
1.@Override 


@Override 修 饰 一 个 方法 ， 表 示 该 方法 不 古 当前 类 首先 声明 的 ， 而 
0 当前 类 “ 重 写 ”* 了 该 方法 ， 比 
0: 


static class Base { 
public void action() {}; 


static class Child extends Base { 
Q@Override 
public void action(){ 
System,out,printJn("child action"); 


QOverride 
public String toString() { 
return "child"; 
} 
} 


Child 的 action 方 法 重 写 了 父 类 Base 中 的 action 方 法 ，toString 方 法 重 
写 了 Object 类 中 的 toString 方 法 。 这 个 注解 不 写 也 不 会 改变 这 些 方法 
是 “ 重 写 ”的 本 质 ， 那 有 什么 用 呢 ? 它 可 以 减少 一 些 编程 错误。 如 果 方 
法 有 Override 注 解 ， 但 没有 任何 父 类 或 实现 的 接口 声明 该 方法 ， 则 编 
译 器 会 报错 ， 强 制程 序 员 修复 该 问题 。 比 如 ， 在 上 面 的 例子 中 ， 如 果 
程序 员 修 改 了 Base 方 法 中 的 action 方 法 定义 ， 变 为 了 : 


static class Base { 
public void doAction() {}; 


} 


但 是 ， 程 序 员 起 记 了 修改 Child 方 法 ， 如 采 没 有 Override 注 解 ， 编 
译 磊 不 会 报告 任何 错误 ， 它 会 认为 action 方 法 是 Child 新 加 的 方法 ， 
doAction 会 调用 父 类 的 方法 ， 这 与 程序 员 的 期 望 古 不 符 的 ， 而 有 了 


Override 注 解 ， 编 译 絮 束 会 报告 错误 。 所 以 ， 如 采 方 法 是 在 父 类 或 接 
口中 定义 的 ， 加 上 @Override 吧 ， 让 编译 器 帮 你 减少 错误 。 


2.ODeprecated 


@Deprecated 可 以 修饰 的 范围 很 三 ， 包 括 类 、 方 法 、 字 上 段 、 参 数 
等 ， 它 表示 对 应 的 代码 已 经 过 时 了 了， 程序 员 不 应 该 使 用 它 ， 不 过 ， 它 
是 一 种 警告 ， 而 不 是 强制 性 的 ， 在 IDE 如 Eclipse 中 ， 会 给 Deprecated 元 
素 加 一 条 删除 线 以 示警 告 。 比 如 ，Date 中 很 多 方法 就 过 时 了 : 


@Deprecated 

public Date(int year, int month, int date) 
@Deprecated 

public int getYear() 


在 声明 元 素 为 @Deprecated 时 ， 应 该 用 Java 文 档 注释 的 方式 同时 说 
明 蔡 代 方 案 ， 束 像 Date 中 的 API 文 档 那 样 ， 在 调用 @Deprecated 方 法 
了 时， 应 该 先 考 虑 其 建议 的 蔡 代 方案 。 


从 Java 9 开始 ，@Deprecated 多 了 两 个 属性 : since 和 forRemoval。 
since 是 一 个 字符 串 ， 表 示 是 从 哪个 版 本 开始 过 时 的 ; forRemoval 是 一 
个 boolean 值 ， 表 示 将 来 是 否 会 删除 。 比 如 ，Java 9 中 Integer 的 一 个 构造 
方法 束 从 版 本 9 开始 过 时 了 ， 其 代码 为 : 


@Deprecated(since="9") 
public Integer(int value) { 
this.value = value,; 


3.OSuppressWarnings 


@SuppressWarnings 表 示 压 制 Java 的 编译 警告 ， 它 有 一 个 必 填 参 
数 ， 表 示 压 制 哪 种 类 型 的 警告 ， 它 也 可 以 修饰 大 部 分 代码 元 素 ， 在 更 
大 沁 围 的 修饰 也 会 对 内 部 元 素 起 效 ， 比 如 ， 在 类 上 的 注解 会 影响 到 方 
法 ， 在 方法 上 的 注解 会 影响 到 代码 行 。 对 于 Date 方 法 的 调用 ， 可 以 这 
样 压制 警告 


@sSuppresswarnings({"deprecation", "unused"}) 
public static void main(String[] args) { 


Date date = new Date(2017, 4, 12); 
int year = date.getYear(); 


} 


Java 提 供 的 内 置 注解 比较 少 ， 我 们 日 常 开发 中 使 用 的 注解 基本 都 
古 目 定义 的 。 不 过 ， 一般 也 不 古 我 们 定义 的 ， 而 是 由 各 种 框架 和 库 定 
义 的 ， 我 们 主要 还 是 根据 它们 的 文档 直接 使 用 。 


22.2 框架 和 库 的 注解 


各 种 框架 和 库 定 义 了 大 量 的 注解 ， 程 序 员 使 用 这 些 注解 配置 框 染 
和 库 ， 与 它们 进行 交互 ， 我 们 先 来 看 一 些 例子 ， 包 括 Jackson、 依 赖 注 
| 、Servlet 3.0、Web 应 用 框架 等 ， 最 后 我 们 总 结 下 使 用 注解 的 思 
维 逻 辑 。 


1.Jackson 


Jackson 是 一 个 通用 的 序列 化 库 ， 程 序 员 可 以 使 用 它 提供 的 注解 对 
序列 化 进行 定制 ， 比 如 : 


.使 用 @JsonIgnore 和 @JsonIgnoreProperties 配 置 包 略 字段 。 


.使 用 @JsonManagedReference 和 @JsonBackReference 配 置 互 相 引 用 


.使 用 @JsonProperty 和 @JsonFormat 配 置 字 段 的 名 称 和 格式 等 。 


在 Java 提 供 注解 功能 之 前 ， 同 样 的 配置 功能 也 是 可 以 实现 的 ， 一 
般 通 过 配置 文件 实现 ， 但 是 配置 项 和 要 配置 的 程序 元 素 不 在 一 个 地 
方 ， 难 以 管理 和 维护 ， 使 用 注解 束 位 单 多 了 ， 代 码 和 配置 放 在 一 起 ， 
一 目 了 然 ， 易于 理解 和 维护 。 


2. 依 赖 注入 容 需 


现代 Java 开 发 经 常 利 用 某 种 框架 管理 对 象 的 生命 周期 及 其 依赖 关 
系 ， 这 个 框架 一 般 称 为 DI (Dependency Injection) 容器 。DI 是 指 依赖 
注入 ， 流 行 的 框架 有 Spring、Guice 等 。 在 使 用 这 些 框架 时 ， 程 序 员 一 
般 不 通过 new 创 建 对 象 ， 而 是 由 容器 管理 对 象 的 创建 ， 对 于 依赖 的 服 
务 ， 也 不 需要 自己 管理 ， 而 是 使 用 注解 表达 依赖 关系 。 这 么 做 的 好 处 
有 很 多 ， 代 码 更 为 简单 ， 也 更 为 灵活 ， 比 如 容器 可 以 根据 配置 返回 一 
个 动态 代理 ， 实 现 AOP， 这 部 分 我 们 在 下 一 章 再 介绍 。 


看 个 简单 的 例子 ，Guice 定 义 了 Inject 注 解 ， 可 以 使 用 它 表 达 依 赖 
关系 ， 比 如 像 下 面 这 样 : 


public class orderService { 
@Inject 


UserService userService,; 
@Inject 
ProductService productService; 
//... 
} 
3.Servlet 3.0 


Servlet 是 Java 为 Web 应 用 提供 的 技术 框架 ， 早 期 的 Servlet 只 能 在 
web.xml 中 进行 配置 ， 而 Servlet 3.0 则 开始 支持 注解 ， 可 以 使 用 
@WebServlet 配 置 一 个 类 为 Servlet， 比 如 : 


@WebsServlet(urlPpatterns = "/async", asyncSupported = true) 
public class AsyncDemoServlet extends HttpServilet {..} 


4.Web 应 用 框架 


在 Web 开 发 中 ， 典 型 的 架构 都 是 MVC (Model-View- 
Controller) ， 上 典型 的 需求 是 配置 哪个 方法 处 理 哪 个 URL 的 什么 HTTP 
方法 ， 然 后 将 HTTP 请 求 参 数 映射 为 Java 方 法 的 参数 。 各 种 框架 如 
Spring MVC、Jersey 等 都 文 持 使 用 注解 进行 配置 ， 比 如 ， 使 用 Jersey 的 
一 个 配置 示例 为 : 


@Path("/hello") 
public class HelloResource { 
@GET 
@Path("test") 
@Produces(MediaType.APPLICATION_JSON) 
public Map<String, Object> test( 
@QueryParam("a") String a) { 
Map<String, Object> map = new HashMap<>(); 
map.put("status", "ok"); 
return map; 
} 
} 


类 HelloResource 将 处 理 Jersey 配 置 的 根 路 径 下 /hello 下 的 所 有 请 
求 ， 而 test 方 法 将 处 理 /hello/test 的 GET 请 求 ， 啊 应 格式 为 JSON， 目 动 
映射 HTTP 请 求 参数 a 到 方法 参数 String a 。 


5. 和 神奇 的 注解 


通过 以 上 的 例子 ， 我 们 可 以 看 出 ， 注 解 似 乎 有 某 种 神奇 的 力量 ， 
通过 简单 的 声明 ， 就 可 以 达到 某 种 效果 。 在 某 些 方面 ， 它 类 似 于 我 们 
之 前 介绍 的 序列 化 ， 序 列 化 机 制 中 通过 简单 的 Serializable 接 口 ，Java 束 
能 自动 处 理 很 多 复杂 的 事情 。 它 也 类 似 于 我 们 在 并 发 部 分 中 介绍 的 
synchronized 天 键 字 ， 通 过 它 可 以 目 动 实现 同步 访问 。 


有 这 些 都 是 声明 式 编 程 风 格 ， 在 这 种 风格 中 ， 程 序 都 由 三 个 组 件 组 
声明 的 关键 字 和 语法 本 身 。 
:系统 /框架 / 库 ， 它 们 人 负责 解释 、 执 行 声 明 式 的 语句 。 
应 用 程序 ， 使 用 声明 式 风 格 写 程序 。 


在 编程 的 世界 里 ， 访 问 数 据 库 的 SQL 语 言 、 编 写 网 页 样式 的 
CSS， 以 及 后 续 章 世 将 要 介绍 的 正则 表达 式 、 轴 数 式 编 程 都 是 这 种 风 
格 ， 这 种 风格 降低 了 编程 的 难度 ， 为 应 用 程序 员 提 供 了 更 为 高 级 的 语 
言 ， 使 得 程序 员 可 以 在 更 高 的 抽象 层次 上 思考 和 解决 问题 ， 而 不 是 陷 
于 底层 的 细节 实现 。 


22.3 创建 注解 


框架 和 库 是 怎么 实现 注解 的 呢 ? 我 们 来 看 注解 的 创建 。 
我 们 通过 一 些 例子 来 说 明 ， 先 看 @Override 的 定义 : 


@Target (ElementType .METHOD) 
@Retention(Retentionpolicy .SOURCE) 
public @interface Override { 


} 


定义 注解 与 定义 接口 有 点 类 似 ， 都 用 了 interface， 不 过 注解 的 
interface 前 多 了 @。 男 外 ， 它 还 有 两 个 元 注解 @Target 和 和 @Retention， 
这 两 个 注解 专门 用 于 定义 注解 本 吴 。@Target 表 示 注 解 的 目标 ， 
@Override 的 目标 是 方法 (ElementType.METHOD) 。ElementType 是 
一 个 枚 举 ， 主 要 可 选 值 有 : 

.TYPE: 表示 类 、 接 口 (包括 注解 ) ， 或 者 枚 举 声 明 ; 

:FIELD: 字段 ， 包 括 枚 举 常 量 ; 

.METHOD: 方法 ; 

.PARAMETER: 方法 中 的 参数 ; 

.CONSTRUCTOR: 构造 方法 ; 

-LOCAL VARIABLE: 本 地 变量 ; 


.MODULE: 模块 (Java 9 引入 的 ) 。 


目标 可 以 有 多 个 ， 用 人 表示 ， 比 如 @SuppressWarnings 的 @Target 
就 有 多 个 。Java 7 的 定义 为 : 


@Target({TYPE, FIELD, METHOD, PARAMETER， CONSTRUCTOR, LOCAL_VARIABLE}) 
@Retention(Retentionpolicy .SOURCE) 
public @interface SuppressWarnings { 


String[] value(); 


如 果 没 有 声明 @Target， 默 认为 适用 于 所 有 类 型 。 


@Retention 表 示 注 解 信息 保留 到 什么 时 候 ， 取 值 只 能 有 一 个 ， 类 
型 为 RetentionPolicy， 它 是 一 个 枚 举 ， 有 三 个 取 值 。 


SOURCE: 只 在 源 代 码 中 保留 ， 编 译 絮 将 代码 编译 为 字 广 码 文 件 
后 就 会 丢掉 。 


:CLASS: 保留 到 字 记 码 文件 中 ， 但 Java 虚 拟 机 将 class 文 件 加 载 到 
内 存 时 不 一 定 会 在 内 存 中 保留 。 


:RUNTIME: 一 直 保 留 到 运行 时 。 


如 果 没 有 声明 @Retention， 则 默认 为 CLASS 。 


@Override 和 @SuppressWarnings 都 是 给 编译 恬 用 的 ， 所 以 
@Retention 都 是 Retention-PolicySOURCE 。 


可 以 为 注解 定义 一 些 参 数 ， 定 义 的 方式 是 在 注解 内 定义 一 些 方 
法 ， 比 如 @Suppress-Warnings 内 定义 的 方法 value， 返 回 值 类 型 表示 参 


数 的 类 型 ， 这 里 是 String[]。 使 用 @Suppress-Warnings 时 必须 给 value 提 
供 值 ， 比 如 : 


@Suppresswarnings(value={"deprecation", "unused"}) 


当 只 有 一 个 参数 ， 且 名 称 为 value 时 ， 提 供 参 数值 时 可 以 省 
略 "value="， 即 上 面 的 代码 可 以 简写 为 : 


Q@SuppresswWarnings({ 人 "deprecation"，"unused"}) 


注解 内 参数 的 类 型 不 是 什么 都 可 以 的 ， 合 法 的 类 型 有 基本 类 型 、 
String、Class、 枚 举 、 注 解 ， 以 及 这 些 类 型 的 数组 。 


参数 定义 时 可 以 使 用 default 指 定 一 个 默认 值 ， 比 如 ，Guice 中 Inject 
注解 的 定义 : 


Q@Target({ METHOD, CONSTRUCTOR, FIELD }) 
@Retention(RUNTIME) 
QDocumented 
public @interface Inject { 
boolean optional() default false,; 


} 


它 有 一 个 参数 optional， 默 认 值 为 false。 如 果 类 型 为 String， 默 认 
值 可 以 为 "， 但 不 能 为 null。 如 采 定 义 了 参数 旦 没有 提供 默认 值 ， 在 使 
用 注解 时 必须 提供 具体 的 值 ， 不 能 为 null 。 


@Inject 多 了 一 个 元 注解 @Documented， 它 表示 注解 信息 包含 到 生 
成 的 文档 中 。 


与 接口 和 类 不 同 ， 注 解 不 能 继承 。 不 过 注解 有 一 个 与 继承 有 关 的 
元 注解 @Inherited， 它 是 什么 意思 呢 ? 我 们 看 个 例子 : 


public class InheritDemo { 
@Inherited 
@Retention(Retentionpolicy .RUNTIME) 
static @interface Test { 


} 
QTest 
static class Base { 


static class Child extends Base { 


public static void main(String[] args) { 
System.out.println(Child.class.isAnnotationPresent(Test.class)); 
} 


} 


Test 是 一 个 注解 ， 类 Base 有 该 注解 ，Child 继 承 了 Base 但 没有 声明 
该 注解 。main 方 法 检查 Child 类 是 否 有 Test 注 解 ， 输 出 为 tue， 这 是 因为 
Test 有 注解 @Inherited， 如 果 去 挥 ， 输 出 会 变 成 false 。 


22.4 查看 注解 信息 


创建 了 注解 ， 就 可 以 在 程序 中 使 用 ， 注 解 指 定 的 目标 ， 提 供需 
的 参数 ， 但 这 还 不 是 不 会 影响 到 程序 的 运行 。 要 影响 程序 ， 我 们 要 人 先 能 
查看 这 些 信息 。 我 们 主要 考虑 @Retention 为 RetentionPolicyRUNTIME 
的 注解 ， 利 用 反射 机 制 在 运行 时 进行 查看 和 利用 这 些 信 息 。 


在 上 一 章 ， 我 们 提 到 了 反射 相关 类 中 与 注解 有 关 的 方法 ， 这 里 汇 
总 说 明 下 ，Class、Field、Method、Constructor 中 都 有 如 下 方法 : 


// 获 取 所 有 的 注解 
public Annotation[] getAnnotations( ) 
// 获 取 所 有 本 元 素 上 直接 声明 的 注解 ， 忽 略 inherited 来 的 
public Annotation[] getDeclaredAnnotations() 
// 获 取 指 定 类 型 的 注解 ， 没 有 返回 null 
public <A extends Annotation> A getAnnotation(Class<A> annotationClass) 
// 判 断 是 否 有 指定 类 型 的 注解 
public boolean 1ISAnnotationPresent( 
Class<? extends Annotation> annotationClass) 


Annotation 是 一 个 接口 ， 它 表示 注解 ， 具 体 定义 为 : 


public interface Annotation { 
boolean equals(0Object obj); 
int hashCode( ); 
String toString(); 
// 返 回 真正 的 注解 类 型 
Class<? extends Annotation> annotationType(); 


实际 上 ， 内 部 实现 时 ， 所 有 的 注解 类 型 都 是 扩展 的 Annotation 。 


对 于 Method 和 Contructor， 它 们 都 有 方法 参数 ， 而 参数 也 可 以 有 注 
解 ， 所 以 它们 都 有 如 下 方法 : 


public Annotation[][] getParameterAnnotations() 


退回 值 是 一 个 二 维 数组 ， 每 个 参数 对 应 一 个 一 维 数组 。 我 们 看 个 
人 简单 的 例子 : 


public class MethodAnnotations 区 
@Target (ElementType .PARAMETER) 
@Retention(Retentionpolicy ,RUNTIME) 
static @interface QueryParam { 

String value(); 
} 


@Target (ElementType .PARAMETER) 

@Retention(Retentionpolicy .RUNTIME) 

static @interface DefaultValue { 
String value() default ""; 

} 


public void hello(@QueryParam("action") String action, 
@QueryParam("sort") @DefaultValue("asc") String sort)t{ 
//... 
} 
public static void main(String[] args) throws Exception { 
Class<?> cls = MethodAnnotations.class; 
Method method = cls.getMethod("hello", 
new Class[]{String.class, String.class}); 
Annotation[][] annts = method.getParameterAnnotations ( ) 
for(int i=0; I<annts, Length; i++){ 
System.out.println("annotations for paramter " + (i+1)); 
Annotation[] anntArr = annts[i]; 
for(Annotation annt : anntArr)t{ 
if(annt instanceof QueryParam){ 
QueryParam dqp = (QueryParam)annt; 
System.out.println(qp.annotationType() 
.getSimpleName()+":"+ gp.value()); 
}else if(annt instanceof DefaultValue)t{ 
DefaultValue dv = (DefaultValue)annt; 
System.out.println(dv.annotationType() 
.getSimpleName()+":"+ dv.value()); 


这 里 定义 了 两 个 注解 @QueryParam 和 人 C@Defaultvalue， 都 用 于 修饰 
方法 参数 ， 方 法 hello 使 用 了 这 两 个 注解 ， 在 main 方 法 中 ， 我 们 演示 了 
如 何 获 取 方 法 参数 的 注解 信息 ， 输 出 为 : 


annotations for paramter 1 
QueryParam:action 
annotations for paramter 2 
QueryParam: sort 
DefaultValue:asc 


代码 比较 简单 ， 束 不 资 述 了 。 


定义 了 注解 ， 通 过 反射 获取 到 广 解 信息 ， 但 具体 怎么 利用 这 些 信 
一 个 是 定制 序列 化 ， 另 一 个 是 DI ( 依 
> AN 号 已 


22.5 注解 的 应 用 : 定制 序列 化 


在 上 一 章 ， 我 们 演示 了 一 个 简单 的 通用 序列 化 类 SimpleMapper， 
在 将 对 象 转换 为 字符 串 时 ， 格 式 是 固定 的 ， 本 广 演 示 如 何 对 输出 格式 
ee 我 们 实现 一 个 简单 的 类 SimpleFormatter， 它 有 一 个 方 


public static String format(Object obj) 


我 们 定义 两 个 注解 ， @Label 和 @Format。@Label 用 于 定制 输出 字 
ee @Format 用 于 定义 日 期 类 型 的 输出 格式 ， 它 们 的 定义 如 


@Retention(RUNTIME) 

@Target (FIELD) 

public @interface Label { 
String value() default ""; 


@Retention(RUNTIME) 

@Target (FIELD) 

public @interface Format { 
String pattern() default "yyyy-MM-dd HH:mm:ss"; 
String timezone() default "GMT+8"; 

} 


可 以 用 这 两 个 注解 来 修饰 要 序列 化 的 类 字段 ， 比 如 : 


static class Student { 
@Label(" 姓 名 ") 
String name; 
@Label(" 出 生 天 ) 
@Format (pattern="yyyy/MM/dd") 
Date born; 
@Label(" 分 数 ") 
double score; 
// 其 他 代码 


我 们 可 以 这 样 来 使 用 SimpleFormatter: 


SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd"); 
Student zhangsan = new Student(" 张 三 ",，sdf.parse("1990-12-12"), 80.9d); 
System.out.println(SimpleFormatter.format(zhangsan)); 


输出 为 : 


出 生日 期 : 1990/12/12 
分 数 : 80 .9 


可 以 看 出 ， 输 出 使 用 了 自 定义 的 字段 名 称 和 日 期 格式 ， 
SimpleFormatterformat () 是 怎么 利用 这 些 注解 的 呢 ? 我 们 看 代码 : 


public static String format(Object obj) { 
try { 
Class<?> cls = obj.getClass(); 
StringBuilder sb = new StringBuilder(); 
for(Field f : cls.getDeclaredFields()) { 
if(!f.isAccessible()) { 
f.setAccessible(true); 


} 
Label label .getAnnotation(Label.class); 
String name abel != null ? label.value() : f.getName(); 
Object value = f.get(ob]j); 
if(value != null && f.getType() == Date.class) { 
value = formatDate(f, value); 


号 下 


sb.append(name + ": " + Value + "\n"); 
} 
return sb.toString(); 
} catch (IllegalAccessException e) { 
throw new RuntimeException(e); 
} 


对 于 日 期 类 型 的 字段 ， 调 用 了 formatDate， 其 代码 为 : 


private static Object formatDate(Field f, Object value) { 
Format format = f.getAnnotation(Format ,class ) ， 
if(format != null) { 
SimpleDateFormat sdf = new SimpleDateFormat(format.pattern()); 
sdf.setTimeZone(TimeZone.getTimeZone(format.timezone())); 
return sdf.format(value); 


} 


return Value 


这 些 代码 都 比较 简单， 我 们 整 不 解释 了 。 


22.6 ”注解 的 应 用 : DI 容 融 


我 们 再 来 看 一 个 简单 的 DI 容 右 的 例子 。 我 们 引入 两 个 注解 ， 一 个 
是 @SimpleInject; 男 一 个 是 @SimpleSingleton， 先 来 看 
(@Simplelnject ° 


1.@Simplelnject 


0 修饰 类 中 字段 ， 表 达 依 赖 和 关系 ， 定 


@Retention(RUNTIME) 

@Target (FIELD) 

public @interface SimpleInject { 
} 


我 们 看 两 个 简单 的 服务 ServiceA 和 ServiceB，ServiceA 依 赖 于 
ServiceB， 它 们 的 定义 如 代码 清单 22-1 所 示 。 


代码 清单 22-1 ”两 个 简单 的 服务 ServiceA 和 ServiceB 


public class ServiceA { 
@SimpleInject 
ServiceB pb， 
public void callB(){ 
b.action( ); 
} 


public class ServiceB { 
public void action(){ 
System.out.println("I'm B"); 


ServiceA 使 用 @SimpleInject 表 达 对 ServiceB 的 依赖 。 


DI 容 絮 的 类 为 SimpleContainer， 提 供 一 个 方法 : 


public static <T> T getIinstance(Class<T> cls) 


应 用 程序 使 用 该 方法 获取 对 象 实例 ， 而 不 是 目 己 new， 使 用 方法 
如 下 所 示 : 


ServiceA a = SimpleContainer.getIinstance(ServiceA.class); 
a.callB( ); 


SimpleContainer.getInstance 会 创建 需要 的 对 象 ， 并 配置 依赖 天 系 ， 
其 代码 为 : 


public static <T> T getIinstance(Class<T> cls) { 


try { 
T obj = cls.newInstance(); 
Field[] fields = cls.getDeclaredFields(); 
for(Field f : fields) { 
if(f.isAnnotationPresent(SimpleInject.class)) { 
if(!f.isAccessible()) { 
f.setAccessible(true); 


} 

Class<?> fieldCcls = f.getType(); 

f.set(obj, getIinstance(fieldcls)); 
} 


return obj; 
} catch (Exception e) { 

throw new RuntimeException(e); 
} 


} 


代码 假定 每 个 类 型 都 有 一 个 public 默 认 构 造 方法 ， 使 用 它 创 建 对 
象 ， 然 后 查看 每 个 字段 ， 如 果 有 SimpleInject 注 解 ， 就 根据 字段 类 型 获 
取 该 类 型 的 实例 ， 并 设置 字段 的 值 。 


2.@SimpleSingleton 


在 上 面 的 代码 中 ， 每 次 获取 一 个 类 型 的 对 象 ， 都 会 狐 创 建 一 个 对 
象 ， 实 际 开发 中 ， 这 可 能 不 是 期 望 的 结果 ， 期 望 的 模式 可 能 是 单 例 ， 
即 每 个 类 型 只 创建 一 个 对 象 ， 该 对 象 被 所 有 访问 的 代码 共享 ， 怎 么 满 
足 这 种 需求 呢 ? 我 们 增加 一 个 注解 @SimpleSingleton， 用 于 修饰 类 ， 
表示 类 型 是 单 例 ， 定 义 如 下 : 


@Retention(RUNTIME) 
@Target (TYPE) 
public @interface SimpleSingleton { 


我 们 可 以 这 样 修 饰 ServiceB: 


@SimpleSingleton 
public class ServiceB { 
public void action(){ 
System.out.println("I'm B"); 


SimpleContainer 也 需要 做 修改 ， 首 先 增加 一 个 静态 变量 ， 缓 存 创 
建 过 的 单 例 对 象 : 


private static Map<Class<?>, Object> instances = new ConcurrentHashMap<>(); 


getInstance 也 需要 做 修改 ， 如 下 所 示 : 


public static <T> T getIinstance(Class<T> cls) { 
try { 
boolean singleton = cls.isAnnotationpresent(SimpleSingleton.class); 
if(!singleton) { 
return createInstance(cls); 


Object obj = instances.get(c]ls); 
if(obj != null) { 
return (T) obj; 


synchronized (cls) { 
obj = instances.get(cls); 
if(obj == nul1) { 
obj = createInstance(cl]ls); 
instances.put(cls, obj); 


} 
} 
return (T) obj; 


} catch (Exception e) { 
throw new RuntimeException(e); 
} 


} 


首先 检查 类 型 是 否 是 单 例 ， 如 果 不 是 ， 束 直接 调用 createInstance 
创建 对 象 。 否 则 ， 检 碍 缓存 ， 如 果 有 ， 直 接 返回 ， 如 果 没 有 ， 则 调用 
createInstance 创 建 对 象 并 放 入 缓存 中 。 


createInstance 与 第 一 版 的 getInstance 类 似 ， 代 码 为 : 


private static <T> T createInstance(Class<T> cls) throws Exception { 
T obj = cls.newInstance(); 
Field[] fields = cls.getDeclaredFields(); 
for(Field f : fields) { 
if(f.isAnnotationpresent(SimpleInject.class)) { 
if(!f.isAccessible()) { 
f.setAccessible(true); 


} 
Class<?> fieldCls = f.getType(); 
f.set(obj, getInstance(fieldcls)); 


} 
return obj; 


本 章 介绍 了 Java 中 的 注解 ， 包 括 注解 的 使 用 、 目 定义 注解 和 应 用 


示例 ， 示 例 的 完整 代码 在 github 上 ， 地 址 为 
https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c85 下 。 


注解 提升 了 Java 语 言 的 表达 能 力 ， 有 效 地 实现 了 应 用 功能 和 底层 


功能 的 分 离 ， 框 染 / 库 的 程序 员 可 以 专注 于 故 层 实现 ， 借 助 反 射 实现 通 
用 功能 ， 提 供 注解 给 应 用 程序 员 使 用 ， 应 用 程序 员 可 以 专注 于 应 用 功 
能 ， 通 过 简单 的 声明 式 注解 与 框 染 / 库 进行 协作 。 


下 一 章 ， 我 们 来 探讨 Java 中 一 种 更 为 动态 灵 活 的 机 制 : 动态 代 


[© 


第 23 章 ”动态 代理 


本 章 ， 我 们 来 探讨 Java 中 另外 一 个 动态 特性 : 动态 代理 。 动 态 代 
理 是 一 种 强大 的 功能 ， 它 可 以 在 运行 时 动态 创建 一 个 类 ， 实 现 一 个 或 
多 个 接口 ， 可 以 在 不 修改 原 有 类 的 基础 上 动态 为 通过 该 类 获取 的 对 象 
添加 方法 、 修 改行 为 ， 这 么 描述 比较 抽象 ， 下 文 会 具体 介绍 。 这 些 特 
性 使 得 它 广泛 应 用 于 各 种 系统 程序 、 框 架 和 库 中 ， 比 如 Spring 、 


Hibernate、MyBatis、Guice 等 。 


动态 代理 是 实现 面向 切面 的 编程 AOP (Aspect Oriented 
Programming) 的 基础 。 切 面 的 例子 有 日 志 、 性 能 监控 、 权 限 检 查 、 数 
据 库 事务 等 ， 它 们 在 程序 的 很 多 地 方 都 会 用 到 ， 代 码 都 差不多 ， 但 与 
某 个 具体 的 业务 逻辑 关系 也 不 太 密 切 ， 如 果 在 每 个 用 到 的 地 方 都 写 ， 
代码 会 很 元 余 ， 也 难以 维护 ，AOP 将 这 些 切 面 与 主体 逻辑 相 分 离 ， 代 
码 人 简单 优雅 得 多 。 


和 注解 类 似 ， 在 大 部 分 的 应 用 编程 中 ， 我 们 不 需要 目 己 实现 动态 
代理 ， 而 只 需要 按照 框架 和 库 的 文档 说 明 进 行使 用 就 可 以 了 。 不 过 ， 
理解 动态 代理 有 助 于 我 们 更 为 深刻 地 理解 这 些 框架 和 库 ， 也 能 更 好 地 
应 用 它们 ， 在 目 己 的 业务 需要 时 ， 也 能 目 己 实现 。 


要 理解 动态 代理 ,我们 首先 要 了 解 静 仿 代 理 ， 了 人 解 了 前 仿 代 理 
后 ， 我 们 再 来 看 动态 代理 。 动 态 代 理 有 两 种 实现 方式 ， 一 种 是 Java 
SDK 提 供 的 ， 男 外 一 种 是 第 三 方 库 (如 cglib) 提供 的 。 我 们 会 分 别 介 
绍 这 两 种 方式 ， 包 括 其 用 法 和 基本 实现 原理 ， 理 解 了 基本 概念 和 原理 
后 ， 我 们 来 看 一 个 简单 的 应 用 ， 实 现 一 个 极 们 的 AOP 框 架 。 


23.1 静态 代理 


我 们 首先 介绍 代理 。 代 理 是 一 个 比较 通用 的 词 ， 作 为 一 个 软件 设 
计 模 式 ， 它 在 《设计 模式 》 一 书 中 被 提出 ， 基 本 概念 和 日 钊 生活 中 的 
概念 是 类 似 的 。 代 理 背 后 一 般 至 少 有 一 个 实际 对 象 ， 代 理 的 外 部 功能 
和 实际 对 象 一 般 是 一 样 的 ， 用 户 与 代理 打交道 ， 不 直接 接触 实际 对 
象 。 虽 然 外 部 功能 和 实际 对 象 一 样 ， 但 代理 有 它 存 在 的 价值 ， 比 如 : 


1) 节省 成 本 比较 高 的 实际 对 象 的 创建 开销 ， 按 需 延 迟 加 载 ， 创 建 
代理 时 并 不 真正 创建 实际 对 象 ， 而 只 是 保存 实际 对 象 的 地 址 ， 在 需要 
时 再 加 载 或 创建 。 

2) 执行 权限 检查 ， 代 理 检 查 权 限 后 ， 再 调用 实际 对 象 。 


3) 屏蔽 网 络 差异 和 复杂 性 ， 代 理 在 本 地 ， 而 实际 对 象 在 其 他 服务 
器 上 ， 调 用 本 地 代理 时 ， 本 地 代理 请 求 其 他 服务 器 。 


代理 模式 的 代码 结构 也 比较 简单 ， 我 们 看 个 简单 的 例子 ， 如 代码 
清单 代码 23-1 所 示 。 


代码 清单 23-1 静态 代理 示例 


public class SimpleStaticPproxyDemo { 
static interface IService { 
public void sayHello(); 


static class RealService implements IService { 
Q@Override 
public void sayHello() { 
System.out.println("hello"); 
} 


} 
static class TraceProxy implements IService { 
private IService realService; 
public TraceProxy(IService realService) { 
this.realService = realService; 


QOverride 
public void sayHello() { 
System,.out,println("entering sayHello"); 
this.realService.sayHello(); 
System.out.println("leaving sayHello"); 
} 
} 


public static void main(String[] args) { 
IService realService = new RealService() 
IService proxyService = new TraceProxy(realService); 
proxyService,.sayHello( ); 


代理 和 实际 对 象 一 般 有 相同 的 接口 ， 在 这 个 例子 中 ， 共 同 的 接口 
是 IService， 实 际 对 象 是 RealService， 代 理 是 TraceProxy。 TraceProxy 内 
部 有 一 个 IService 的 成 员 变 量 ， 指 向 实 际 对 象 ， 在 构造 方法 中 被 初始 
化 ， 对 于 方法 sayHello 的 调用 ， 它 转发 给 了 实际 对 象 ， 在 调用 前 后 输 
出 了 一 些 跟 踩 调 试 信 息 ， 程 序 输出 为 : 


entering sayHello 
hello 
leaving sayHello 


我 们 在 第 12 章 介绍 过 两 种 设计 模式 ， 适 配 占 和 沪 饰 侨 ， 它 们 与 代 
理 模 式 有 点 类 似 ， 它 们 的 背后 部 有 一 个 别 的 实际 对 象 ， 都 古 通 过 组 合 
的 方式 指 回 该 对 象 ， 不 同 之 处 在 于 ， 适 配 乞 是 提供 了 一 个 不 一 样 的 新 
接口 ， 凌 饰 吉 是 对 原 接口 起 到 了 “ 半 饰 ?作用 ， 可 能 是 增加 了 新 接 口 、 
修改 了 原 有 的 行为 等 ， 代 理 一 般 不 改变 接口 。 不 过 ， 我 们 并 不 想 强 调 
它们 的 差别 ， 可 以 将 它们 看 作 代理 的 变 体 ， 统 一 看 竺 。 


在 上 面 的 例子 中 ， 我 们 想 达 到 的 目的 是 在 实际 对 象 的 方法 调用 前 
后 加 一 些 调试 语句 。 为 了 在 不 修改 原 类 的 情况 下 达到 这 个 目的 ， 我 们 
在 代码 中 创建 了 一 个 代理 类 TraceProxy， 它 的 代码 是 在 写 程序 时 固定 
的 ， 所 以 称 为 静态 代理 。 


输出 跟踪 调试 信息 是 一 个 通用 需求 ， 可 以 想象 ， 如 果 每 个 类 都 需 
要 ， 而 又 不 希望 修改 类 定义 ， 我 们 需要 为 每 个 类 创建 代理 ， 实 现 所 有 
接口 ， 这 个 工作 就 太 烦琐 了 ， 如 果 再 有 其 他 的 切面 需求 ， 整 个 工作 可 
能 义 要 重 来 一 授 。 这 时 ， 束 需要 动态 代理 了 ， 主 要 有 两 种 方式 实现 动 
态 代理 : Java SDK 和 第 三 方 库 cglib， 我 们 先 来 介绍 Java SDK。 


23.2 Java SDK 动 态 代理 
我 们 先 介绍 它 的 用 法 ， 然 后 介绍 实现 原理 ， 最 后 分 析 它 的 优点 。 
23.2.1 用 法 


在 静态 代理 中 ， 代 理 类 是 直接 定义 在 代码 中 的 ， 在 动态 代理 中 ， 
代理 类 是 动态 生成 的 ， 怎 么 动态 生成 呢 ? 我 们 用 动态 代理 实现 前 面 的 
例子 ， 如 代码 清单 23-2 所 示 。 


代码 清单 23-2 使 用 Java SDK 实 现 动态 代理 示例 


public class SimpleJDKDynamicProxyDemo { 
static interface IService { 
public void sayHello(); 


static class RealService implements IService { 
QOverride 
public void sayHello() { 
System.out.println("hello"); 
} 


static class SimpleInvocationHandler implements InvocationHandler { 
private Object real0bj ， 
public SimpleInvocationHandler(Object realobj) { 
this,realobj = real0bj ， 


Q@override 
public Object invoke(Object proxy, Method method, 
Object[] args) throws Throwable { 
System,.out,println("entering " + method.getName()); 
Object result = method,.invoke(real0bj, args); 
System.out.println("leaving " + method.getName()); 
return result; 


} 


public static void main(String[] args) { 
IService realService = new RealService(); 
IService proxyService = (IService) Proxy.newProxyInstance( 
IService.class.getClassLoader(), new Class<?>[] { IService.class }, 
new SimpleInvocationHandler (realService)); 
proxyService,.sayHello( ); 


代码 看 起 来 更 为 复杂 了 ， 这 有 什么 用 呢 ? 别 着 急 ， 我 们 慢 慢 解 
释 。IService 和 Real-Service 的 定义 不 变 ， 程 序 的 输出 也 没 变 ， 但 代理 对 
象 proxyService 的 创建 方式 变 了 ， 它 使 用 java.lang.reflect 包 中 的 Proxy 类 
的 静态 方法 newProxyInstance 来 创建 代理 对 象 ， 这 个 方法 的 声明 如 下 : 


public static Object newProxyInstance(ClassLoader loader, 
Class<?>[] interfaces, InvocationHandler h 


它 有 三 个 参数 ， 具 体 如 下 。 


1) loader 表 示 类 加 载 咽 ， 下 一 章 我 们 会 单独 探讨 ， 例 子 使 用 和 
IService 一 样 的 类 加 载 右 。 


2) interfaces 表 示 代 理 类 要 实现 的 接口 列表 ， 是 一 个 数组 ， 元 素 的 
类 型 只 能 是 接口 ， 不 能 是 普通 的 类 ， 例 子 中 只 有 一 个 IService 。 


3) hb 的 类 型 为 InvocationHandler， 它 是 一 个 接口 ， 也 定义 在 
java.lang.reflect 包 中 ， 它 只 定义 了 一 个 方法 invoke， 对 代理 接口 所 有 方 
法 的 调用 都 会 转 给 该 方法 。 


newProxyInstance 的 返回 值 类 型 为 Object， 可 以 强制 转换 为 
interfaces 数 组 中 的 某 个 接口 类 型 。 这 里 我 们 强制 转换 为 了 IService 类 
型 ， 需 要 注意 的 是 ， 它 不 能 强制 转换 为 某 个 类 类 型 ， 比如 
RealService， 即 使 它 实际 代理 的 对 象 类 型 为 RealService 。 

SimpleInvocationHandler 实 现 了 InvocationHandler， 它 的 构造 方法 
接受 一 个 参数 realObj 表 示 被 代理 的 对 象 ，invoke 方 法 处 理 所 有 的 接口 
调用 ， 它 有 三 个 参数 : 


1) proxy 表 示人 代理 对 象 本 喘 ， 需 要 注意 ， 它 不 是 被 代理 的 对 象 ， 
这 个 参数 一 般 用 处 不 大 。 


2) method 表 示 正 在 被 调 用 的 方法 。 
3) args 表 示 方 法 的 参数 。 


在 SimpleInvocationHandler 的 invoke 实 现 中 ， 我 们 调用 了 method 的 
invoke 方 法 ， 传 递 了 实际 对 象 realObj 作 为 参数 ， 达 到 了 调用 实际 对 象 


对 应 方法 的 目的 ， 在 调用 任何 方法 前 后 ， 我 们 输出 了 跟踪 调试 语句 。 
需要 注意 的 是 ， 不 能 将 proxy 作 为 参数 传递 给 method.invoke， 比如 : 


Object result = method.invoke(proxy, args); 


上 面 的 语句 会 出 现 死 循环 ， 因 为 proxy 表 示 当 前 代理 对 象 ， 这 又 会 
调用 到 SimpleIn-vocationHandler 的 invoke 方 法 。 


23.2.2 ”基本 原理 


看 了 上 面 的 介绍 是 不 是 更 巡 了 ， 没 关系 ， 看 下 
Proxy.newProxyInstance 的 内 部 瓯 理解 了 。 代 码 请 单 23-2 中 创建 
proxyService 的 代码 可 以 用 如 下 代码 代替 : 


Class<?> proxyCls = Proxy,getProxyClass(IService,.class,getClassLoader( )， 
new Class<?>[] { IService.class }); 
Constructor<?> ctor = proxyCls.getConstructor( 
new Class<?>[] { InvocationHandler.class }); 
InvocationHandler handler = new SimpleInvocationHandler(realService); 
IService proxyService = (IService) ctor.newInstance(handler); 


作为 三 步 ， 
1) 通过 Proxy.getProxyClass 创 建 代理 类 定义 ， 类 定义 会 被 缓存 ; 


2) 获取 代理 类 的 构造 方法 ， 构 造 方法 有 一 个 InvocationHandler 类 
型 的 参数 ; 

3) 创建 InvocationHandler 对 象 ， 创 建 代理 类 对 象 。 

Proxy.getProxyClass 需 要 两 个 参数 : 一 个 是 ClassLoader; 另 一 个 是 
接口 数组 。 它 会 动态 生成 一 个 类 ， 类 名 以 $Proxy 开 头 ， 后 跟 一 个 数 
字 。 对 于 上 面 的 例子 ,动态 生成 的 类 定义 如 代码 清单 23-3 所 示 ， 为 简 
化 起 见 ， 我 们 忽略 了 异常 处 理 的 代码 。 


代码 清单 23-3 ”Java SDK 动 态 生 成 的 代理 类 示例 


final class $Proxy0 extends Proxy implements 

SimpleJDKDynamicProxyDemo.IService { 

private static Method mi1; 

private static Method m3; 

private static Method m2; 

private static Method mo; 

public $Proxy9(InvocationHandler paramInvocationHandler) { 
super(paramInvocationHandler ) ; 


public final boolean equals(Object paramobject) { 
return((Boolean) this.h.invoke(this, ml, 
new Object[] { paramobject })).booleanvalue!(); 


} 
public final void sayHello() { 
this.h.invoke(this, m3, null); 


} 
public final String toString() { 
return (String) this.h.invoke(this, m2, null); 


} 
public final int hashCode() { 
return ((Integer) this.h,.invoke(this, m0O, null)).intValue(); 


static { 

ml = Class.forName("java.lang.0bject").getMethod("equals", 
new Class[] { Class.forName("java.lang.O0bject") }); 

m3 = Class.forName( 
"laoma.demo.proxy.SimpleJDKDynamicProxyDemo$IService") 
.getMethod("sayHello",new Class[0]); 

m2 = Class.forName("java.1lang.Object") 
.getMethod("toString", new Class[0]); 

mo = Class.forName("java.lang.O0bject") 
.getMethod("hashCode", new Class[0]); 


$Proxy0 的 父 类 是 Proxy， 它 有 一 个 构造 方法 ， 接 受 一 个 
InvocationHandler 类 型 的 参数 ， 你 存 为 了 实例 变量 h，h 定 义 在 父 类 
Proxy 中 ， 它 实现 了 接口 IService， 对 于 每 个 方法 ， 如 sayHello， 它 调用 
InvocationHandler 的 invoke 方 法 ， 对 于 Object 中 的 方法 ， 如 hash-Code、 
equals 和 toString，$Proxy0 同 样 转发 给 了 InvocationHandler 。 


可 以 看 出 ， 这 个 类 定义 本 和 喘 与 被 代理 的 对 象 没 有 关系 ， 与 
InvocationHandler 的 具体 实现 也 没有 关系 ， 而 主要 与 接口 数组 有 关 ， 给 
定 这 个 接口 数组 ， 它 动态 创建 每 个 接口 的 实现 代码 ， 实 现职 是 转发 给 
InvocationHandler， 与 被 代理 对 象 的 关系 以 及 对 它 的 调用 由 
InvocationHandler 的 实现 管理 。 


我 们 是 怎么 知道 $Proxy0 的 定义 的 呢 ? 对 于 Oracle 的 JVM， 可 以 配 
置 java 的 一 个 属性 得 到 ， 比 如: 


java -Dsun.misc.ProxyGenerator.saveGeneratedFiles=true 
shuo.laoma.dynamic.c86.SimpleJDKDynamicProxyDemo 


以 上 命令 会 把 动态 生成 的 代理 类 $Proxy0 保 存 到 文件 $Proxy0.class 
中 ， 通 过 一 些 反 编译 器 工具 比如 JD-GUI (http://jd.benow.ca/ ) 就 可 以 
得 到 源码 。 


理解 了 代理 类 的 定义 ， 后 面 的 代码 就 比较 容易 理解 了 ， 台 是 获取 
构造 方法 ， 创 建 代理 对 象 。 


23.23 WIC 


相 比 静态 代理 ， 动 态 代 理 看 起 来 麻烦 了 很 多 ， 它 有 什么 好 处 呢 ? 
使 用 动态 代理 ， 可 以 编写 通用 的 代理 逻辑 ， 用 于 各 种 类 型 的 被 代理 对 
象 ， 而 不 需要 为 每 个 被 代理 的 类 型 都 创建 一 个 静态 代理 类 。 看 个 简单 
的 示例 ， 如 代码 清单 23-4 所 示 。 


代码 清单 23-4 通用 的 动态 代理 类 示例 


public class GeneralproxyDemo { 
static interface IServiceA { 
public void sayHello(); 


static class ServiceAImpl implements IServiceA { 
Q@Override 
public void sayHello() { 
System.out.println("hello"); 


static interface IServiceB { 
public void fly(); 


static class ServiceBImpl implements IServiceB { 
QOverride 
public void fly() { 
System.out.println("flying"); 
} 


static class SimpleInvocationHandler implements InvocationHandler { 
private Object real0bj ， 
public SimpleInvocationHandler(Object realobj) { 
this,realobj = real0bj ， 


Q@Override 
public Object invoke(Object proxy, Method method, Object[] args) 
throws Throwable 区 
System,.out ,println("entering " + real0bj,getClass() 
.getSimpleName() + "::" + method,getName() )， 


Object result = method,invoke(realobj，args ) ， 
System.out.println("leaving " + realobj.getClass() 
.getSimpleName() + "::" + method,getName() )， 
return result; 
} 
} 
private static <T> T getProxy(Class<T> intf, T realobj) { 
return (T) Proxy.newProxyInstance(intf.getclassLoader(), 
new Class<?>[] { intf }, new SimpleInvocationHandler(real0bj)); 


public static void main(String[] args) throws Exception { 
IServiceA a = new ServiceAImpl1(); 
IServiceA apProxy = getProxy(IServiceA.class, a); 
aProxy .sayHello( ); 
IServiceB b = new ServiceBImpl1(); 
IServiceB bProxy = getProxy(IServiceB.class, b); 
bProxy ,fly()， 


在 这 个 例子 中 ， 有 两 个 接口 IJServiceA 和 IServiceB ， 它 们 对 应 的 实 
现 类 是 Service-AImpl 和 ServiceBImpl， 虽 然 它 们 的 接口 和 实现 不 同 ， 但 
利用 动态 代理 ， 它 们 可 以 调用 同样 的 方法 getProxy 获 取代 理 对 象 ， 共 
享 同 样 的 代理 逻辑 SimpleInvocationHandler， 即 在 每 个 方法 调用 前 后 输 
出 一 条 跟踪 调试 语句 。 程 序 输出 为 : 


entering ServiceAImp1: :SayHe11o 
hello 

leaving ServiceAImpl::sayHello 
entering ServiceBImpl::fly 
flying 

leaving ServiceBImpl::fly 


23.3 ”cglib 动 态 代 理 


Java SDK 动 态 代 理 的 局 限 在 于 ， 它 只 能 为 接口 创建 代理 ， 返 回 的 
代理 对 象 也 只 能 转换 到 某 个 接口 类 型 ， 如 果 一 个 类 没有 接口 ， 或 者 项 
望 代理 非 接口 中 定义 的 方法 ， 那 束 没 有 办 法 了 。 有 一 个 第 三 方 的 类 库 
cglib (https://github.com/cglib/cglib ) ， 可 以 做 到 这 一 点 ，Spring、 
Hibernate 等 都 使 用 该 类 库 。 我 们 看 个 简单 的 例子 ， 如 代码 清单 23-5 所 
RR? 


代码 清单 23-5 ”cglib 动 态 代 理 示 例 


public class SimpleCGLibDemo { 
static class RealService { 
public void sayHello() { 
System.out.println("hello"); 


static class SimpleInterceptor implements MethodInterceptor { 
Q@override 
public Object intercept(Object object, Method method, 
Object[] args, MethodProxy proxy) throws Throwable { 
System.out.println("entering " + method.getName()); 
Object result = proxy.invokeSuper(object, args); 
System.out.println("leaving " + method.getName()); 
return result; 
} 
} 
private static <T> T getProxy(Class<T> cls) { 
Enhancer enhancer = new Enhancer(); 
enhancer .setSuperclass(cls); 
enhancer .setCcallback(new SimpleInterceptor()); 
return (T) enhancer.create(); 


public static void main(String[] args) throws Exception { 
RealService proxyService = getProxy(RealService.class); 
proxyService,.sayHello( ); 


RealService 表 示 被 代理 的 类 ， 它 没有 接口 。getProxy () 为 一 个 类 
生成 代理 对 象 ， 这 个 代理 对 象 可 以 安全 地 转换 为 被 代理 类 的 类 型 ， 叱 
使 用 了 cglib 的 Enhancer 类 。Enhancer 类 的 setSuperclass 设 置 被 代理 的 
类 ，setCallback 设 置 被 代理 类 的 public 非 final 方 法 被 调用 时 的 处 理 类 。 
Enhancer 支 持 多 种 类 型 ， 这 里 使 用 的 类 实现 了 MethodInterceptor 接 口 ， 


它 与 Java SDK 中 的 InvocationHandler 有 点 类 似 ， 方 法 名 称 变 成 了 
intercept， 多 了 一 个 MethodProxy 类 型 的 参数 。 


与 前 面 的 InvocationHandler 不 同 ，SimpleInterceptor 中 没有 被 代理 


的 对 象 ， 它 通过 MethodProxy 的 invokeSuper 方 法 调用 被 代理 类 的 方 
法 : 


Object result = proxy.invokeSsuper(object, args); 
注意 ， 它 不 能 这 样 调用 被 代理 类 的 方法 : 
Object result = method,.invoke(object, args); 


object 是 代理 对 象 ， 调 用 这 个 方法 还 会 调用 到 SimpleInterceptor 的 
intercept 方 法 ， 造 成 死 循 环 。 


在 main 方 法 中 ， 我 们 也 没有 创建 被 代理 的 对 象 ， 创 建 的 对 象 直接 
就 是 代理 对 象 。 


cglib 的 实现 机 制 与 Java SDK 不 同 ， 它 是 通过 继承 实现 的 ， 它 也 是 
动态 创建 了 一 个 类 ， 但 这 个 类 的 父 类 是 被 代理 的 类 ， 代 理 类 重 写 了 父 
类 的 所 有 public 非 final 方 法 ， 改 为 调用 Callback 中 的 相关 方法 ， 在 上 例 
中 ， 调 用 SimpleInterceptor 的 intercept 方 法 。 


23.4 _ Java SDK 代理 与 cglib 代 理 比 较 


Java SDK 代 理 面 向 的 是 一 组 接口 ， 它 为 这 些 接口 动态 创建 了 一 个 
实现 类 。 接 口 的 具体 实现 逻辑 是 通过 目 定 义 的 InvocationHandler 实 现 
的 ， 这 个 实现 是 自 定 义 的 ， 也 就 是 说 ， 其 背后 都 不 一 定 有 真正 被 代理 
的 对 象 ， 也 可 能 有 多 个 实际 对 象 ， 根 据 情 况 动态 选择 。cglib 代 理 面 回 
和 它 动 态 创建 了 一 个 新 类 ， 继 承 了 该 类 ， 重 写 了 其 

有 


从 代理 的 角度 看 ，Java SDK 代 理 的 是 对 象 ， 需要 先 有 一 个 实际 对 
象 ， 目 定义 的 InvocationHandler 引 用 该 对 象 ， 然 后 创建 一 个 代理 类 和 代 
理 对 象 ， 客 户 端 访问 的 是 代理 对 象 ， 代 理 对 象 最 后 再 调用 实际 对 象 的 
方法 ; cglib 代 理 的 是 类 ， 创 建 的 对 象 只 有 一 个 。 


如 有 果 目 的 都 古 为 一 个 类 的 方法 增强 功能 ，Java SDK 要 求 该 类 必须 
有 接口 ， 且 只 能 处 理 接口 中 的 方法 ，cglib 没 有 这 个 限制 。 


23.5 “动态 代理 的 应 用 : AOP 


利用 cglib 动 态 代 理 ， 我 们 实现 一 个 极 简 的 AOP 框 架 ， 演 示 AOP 的 
基本 思路 和 技术 ， 先 来 看 这 个 框架 的 用 法 ， 然 后 分 析 其 实现 原理 。 


23.5.1 用 法 


我 们 添加 一 个 新 的 注解 @Aspect， 其 定义 为 : 


@Retention(RUNTIME) 

@Target (TYPE) 

public @interface Aspect { 
Class<?>[] value(); 

} 


i 它 用 于 注解 切面 类 ， 它 有 一 个 参数 ， 可 以 指定 要 增强 的 类 ， 比 
站: 


@Aspect( {ServiceA.class, ServiceB.class}) 
public class ServiceLogAspect 


ServiceLogAspect 就 是 一 个 切面 ， 它 负责 类 ServiceA 和 ServiceB 的 
日 志 切 面 ， 即 为 这 两 个 类 增加 日 志 功 能 。 再 如 : 


@Aspect( {ServiceB.class}) 
public class ExceptionAspect 


ExceptionAspect 也 是 一 个 切面 ， 它 负责 类 ServiceB 的 异常 切面 。 


这 些 场面 类 与 主体 类 怎么 协作 呢 ? 我 们 约定 ， 切 面 类 可 以 声明 三 
个 方法 before/after/exception， 在 主体 类 的 方法 调用 前 /调用 后 /出 现 异常 
时 分 别 调用 这 三 个 方法 ， 这 三 个 方法 的 声明 需 符 合 如 下 签名 : 


public static void before(Object object, Method method, Object[] args) 
public static void after(Object object, Method method, 


Object[] args, Object result) 
public static void exception(Object object, Method method, 
Object[] args, Throwable e) 


object、method 和 args 与 cglib MethodInterceptor 中 的 invoke 参 数 一 
样 ，after 中 的 result 表 示 方 法 执行 的 结果 ，exception 中 的 e 表 示 发 生 的 异 


ServiceLogAspect 实 现 了 before 和 after 方 法 ， 加 了 一 些 日 志 ， 如 代 
码 清单 23-6 所 示 。 


代码 清单 23-6 “日志 切面 类 


@Aspect({ ServiceA.class, ServiceB,.class }) 
public class ServiceLogAspect { 
public static void before(Object object, Method method, Object[] args) { 
System.out.println("entering " + method.getDeclaringClass() 
.getSimpleName() + "::" + method,getName() 
+ ", args: " + Arrays.toString(args)); 


public static void after(Object object, Method method, Object[] args, 
Object result) { 
System.out.println("leaving " + method.getDeclaringClass() 
.getSimpleName() + "::" + method,getName() 
+ ", result: " + result); 


ExceptionAspect 只 实现 exception 方 法 ， 在 异常 发 生 时 ， 输 出 一 些 
信息 ， 如 代码 清单 23-7 所 示 。 


代码 清单 23-7 异常 切面 类 


@Aspect({ ServiceB,.class }) 
public class ExceptionAspect { 
public static void exception(Object object, 
Method method, Object[] args, Throwable e) { 
System.err.println("exception when calling: " 
+ method.getName() + "," + Arrays.toString(args)); 


ServiceLogAspect 的 目的 是 在 类 ServiceA 和 ServiceB 所 有 方法 的 执 
行 前 后 加 一 些 日 志 ， 而 ExceptionAspect 的 目的 是 在 类 ServiceB 的 方法 执 


行 出 现 异 常 时 收 到 通知 并 输出 一 些 信息 。 它 们 都 没有 修改 类 ServiceA 
和 ServiceB 本 身 ， 本 和 丑 做 的 事 是 比较 通用 的 ， 与 ServiceA 和 ServiceB 的 
具体 逻辑 关系 也 不 密切 ， 但 又 想 改变 ServiceA/ServiceB 的 行为 ， 这 职 
是 AOP 的 思维 。 


只 是 声明 一 个 切面 类 是 不 起 作用 的 ， 我 们 需要 与 第 22 章 介绍 的 DI 
容器 结合 起 来 。 我 们 实现 一 个 新 的 容器 CGLibContainer， 它 有 一 个 方 
法 : 


et 


public static <T> T getIinstance(Class<T> cls) 


通过 该 方法 获取 ServiceA 或 ServiceB， 它 们 的 行为 就 会 被 改变 ， 
ServiceA 和 ServiceB 的 定义 与 第 22 章 一 样 ， 如 代码 清单 22-1 所 示 ， 这 里 
就 不 重复 了 。 


通过 CGLibContainer 获 取 ServiceA， 会 自动 应 用 
ServiceLogAspect， 比 如 : 


ServiceA a = CGLibContainer.getIinstance(ServiceA.class); 
a.callB( ); 


输出 为 : 


entering ServiceA::callB, args: [] 
entering ServiceB::action, args: [|] 
I'mB 

leaving ServiceB::action, result: null 
leaving ServiceA::callB, result: null 


23.5.2 ”实现 原理 


这 是 怎么 做 到 的 呢 ? CGLibContainer 在 初始 化 的 时 候 ， 会 分 析 带 
有 @Aspect 注 解 的 类 ， 分 析出 每 个 类 的 方法 在 调用 前 /调用 后 /出 现 异 第 
时 应 该 调用 哪些 方法 ， 在 创建 该 类 的 对 象 时 ， 如 果 有 需要 被 调用 的 方 
法 ， 则 创建 一 个 动态 代理 对 象 ， 下 面 我 们 具体 来 看 下 代码 。 


为 简化 起 见 ， 我 们 基于 第 22 章 介绍 的 DI 容 器 的 第 一 个 版 本 ， 即 每 
次 获取 对 象 时 都 创建 一 个 ， 不 文 持 单 例 。 我 们 定义 一 个 枚 举 
InterceptPoint， 表 示 切 点 (调用 前 /调用 后 /出 现 异常 ) 


public static enum InterceptPoint { 
BEFORE, AFTER, EXCEPTION 
} 


在 CGLibContainer 中 定义 一 个 静态 变量 ， 表 示 每 个 类 的 每 个 切 点 
的 方法 列表 ， 定 义 如 下 : 


static Map<Class<?>, Map<InterceptPoint, List<Method>>> interceptMethodsMap 
= new HashMap<>(); 


我 们 在 CGLibContainer 的 类 初始 化 过 程 中 初始 化 该 对 象 ， 方 法 是 
分 析 每 个 珊 有 @Aspect 注 解 的 类 ， 这 些 类 一 般 可 以 通过 扫描 所 有 的 类 
得 到 ， 为 简化 起 见 ， 我 们 将 它们 写 在 代码 中 ， 如 下 所 示 : 


static Class<?>[] aspects = new Class<?>[] { 
ServiceLogAspect.class, ExceptionAspect.class }; 


分 析 这 些 带 @Aspect 注 解 的 类 ， 并 初始 化 interceptMethodsMap 的 代 
码 如 下 所 示 : 


static { 
init(); 


private static void init() { 
for(Class<?> cls : aspects) { 
Aspect aspect = cls.getAnnotation(Aspect.c]lass); 
if(aspect != null) { 
Method before = getMethod(cls, "before", new Class<?>[] { 
Object.class, Method.class, Object[].class }); 
Method after = getMethod(cls, "after", new Class<?>[] { 
Object.class, Method.class, Object[].class, Object.class }); 
Method exception = getMethod(cls, "exception", new Class<?>[] { 
Object.class, Method.class, Object[].class, Throwable.class }); 
Class<?>[] intercepttedArr = aspect.value(); 
for(Class<?> interceptted : intercepttedArr) { 
addIinterceptMethod(interceptted, 
InterceptPoint.BEFORE, before); 
addInterceptMethod(interceptted, InterceptPoint.AFTER, after); 
addInterceptMethod(interceptted, 


InterceptPoint , EXCEPTION，exception) ， 


对 每 个 切面 ， 即 市 有 @Aspect 注 解 的 类 cls， 查 找 其 
before/after/exception 方 法 ， 调 用 方法 addInterceptMethod 将 其 加 入 目标 
类 的 切 点 方法 列表 中 ，addInterceptMethod 的 代码 为 : 


private static void addIinterceptMethod(Class<?> cls, 
InterceptPoint point, Method method) { 
if(method == null) { 
return; 


Map<InterceptPoint, List<Method>> map = interceptMethodsMap.get(c1ls); 
if(map == null) { 

map = new HashMap<>(); 

interceptMethodsMap.put(cls, map); 


} 
List<Method> methods = map.get(point); 
if(methods == null) { 
methods = new ArrayList<>(); 
map.put(point, methods); 


methods.add(method ) ， 


准备 好 了 每 个 类 的 每 个 切 点 的 方法 列表 ， 我 们 来 看 根据 类 型 创建 
实例 的 代码 : 


private static <T> T createInstance(Class<T> cls) 
throws InstantiationException, IllegalAccessException { 
if(!interceptMethodsMap.containskey(cls)) { 
return (T) cls.newInstance(); 


Enhancer enhancer = new Enhancer(); 

enhancer .setSuperclass(cls); 

enhancer .setCcallback(new AspectInterceptor()); 
return (T) enhancer.create(); 


如 果 类 型 cls 不 需要 增强 ， 则 直接 调用 cls.newInstance () ， 否 则 使 
用 cglib 创 建 动态 代理 ，callback 为 AspectInterceptor， 其 代码 为 : 


static class AspectInterceptor implements MethodInterceptor { 
QOverride 


public Object intercept(Object object, Method method, 

Object[] args, MethodProxy proxy) throws Throwable { 
// 执 行 before 方 法 
List<Method> beforeMethods = getIinterceptMethods( 

object ,getClass(),.getSuperclass()，InterceptPoint , BEFORE ) ， 

for(Method m : beforeMethods) { 

m.invoke(null, new Object[] { object, method, args }); 
} 


try { 
// 调 用 原始 方法 
Object result = proxy.invokeSuper(object, args); 
// 执 行 after 方 法 
List<Method> afterMethods = getIinterceptMethods( 
object ,getClass(),.getSuperclass()，InterceptPoint ,AFTER ) ， 

for(Method m : afterMethods) { 

m.invoke(null, new Object[] { object, method, args, result }); 
} 


return result; 

} catch (Throwable e) { 
// 执 行 exception 方 法 
List<Method> exceptionMethods = getInterceptMethods( 

object.getclass().getSuperclass(), InterceptPoint.EXCEPTION); 
for(Method m : exceptionMethods) { 

m.invoke(null, new Object[] { object, method, args, e }); 
} 


throw e; 


这 上 段 代码 也 容易 理解 ， 它 根据 原始 类 的 实际 类 型 查找 应 该 执行 的 
before/afterexception 方 法 列表 ， 在 调用 原始 方法 前 执行 before 方 法 ， 执 
行 后 执行 after 方 法 ， 出 现 异 党 时 执行 exception 方 法 。 
getInterceptMethods 方 法 的 代码 为 : 


static List<Method> getIinterceptMethods(Class<?> cls, 
InterceptPoint point) { 
Map<InterceptPoint, List<Method>> map = interceptMethodsMap.get(c1ls); 
if(map == null) { 
return Collections.emptyList(); 
} 
List<Method> methods = map.get(point); 
if(methods == null) { 
return Collections.emptyList(); 
} 


return methods,; 


这 上 段 代 码 也 容易 理解 。CGLibContainer 最 终 的 getInstance 方 法 就 简 
单 了 ， 它 调用 create-Instance 创 建 实 例 ， 代 码 如 下 所 示 : 


public static <T> T getIinstance(Class<T> cls) { 
try { 

T obj = createInstance(cl]ls); 

Field[] fields = cls.getDeclaredFields(); 

for(Field f : fields) { 

if(f.isAnnotationPpresent(SimpleInject.class)) { 
if(!f.isAccessible()) { 
f.setAccessible(true); 


} 
Class<?> fieldCcls = f.getType(); 
f.set(obj，getInstance(fieldCls) ) ; 


return obj; 
} catch (Exception e) { 

throw new RuntimeException(e); 
} 


} 


相 比 完整 的 AOP 框 架 ， 这 个 AOP 的 实现 是 非常 粗糙 的 ， 主 要 用 于 
解释 动态 代理 的 应 用 和 AOP 的 一 些 基 本 思路 和 原理 。 完 整 的 代码 在 
github 上， 地 址 为 https://github.com/swift-ma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c86 下 。 


本 章 控 讨 了 Java 中 的 代理 ， 从 静态 代理 到 两 种 动态 代理 。 动 态 代 
理 广 泛 应 用 于 各 种 系统 程序 、 框 漆 和 库 中 ， 用 于 为 应 用 程序 员 提供 易 
用 的 文 持 、 实 现 AOP， 以 及 其 他 灵活 通用 的 功能 ， 理 解 了 动态 代理 ， 
我 们 惑 能 更 好 地 利用 这 些 系统 程序 、 框 淋 和 库 ， 在 需要 的 时 候 ， 也 可 
以 目 己 创建 动态 代理 。 


下 一 章 ， 我 们 来 进一步 理解 Java 二 的 关 加 载 过 才 程 ， 探 讨 如 何 利用 
目 定义 的 类 加 载 右 实现 更 为 动态 强大 的 功能 


第 24 章 ”类 加 载 机 制 


在 前 几 意 中， 我 们 多 次 提 到 了 类 加 载 絮 ClassLoader， 本 章 就 来 详 
细 讨 论 Java 中 的 类 加 载 机 制 与 ClassLoader。 


类 加 载 右 ClassLoader 就 是 加 载 其 他 类 的 类 ， 它 负责 将 字 世 码 文件 
加 载 到 内 存 ， 创 建 Class 对 象 。 与 之 前 介绍 的 反射 、 注 解 和 动态 代理 一 
样 ， 在 大 部 分 的 应 用 编程 中 ， 我 们 需要 目 己 实现 ClassLoader 。 


不 过 ， 理 解 类 加 载 的 机 制 和 过 程 ， 有 助 于 我 们 更 好 地 理解 之 前 介 
绍 的 内 容 。 在 反射 一 草 ， 我 们 介绍 过 Class 的 静态 方法 Class.forName， 
理解 类 加 载 妖 有 助 于 我 们 更 好 地 理解 该 方法 。 


ClassLoader 一 般 是 系统 提供 的 ， 不 需要 目 己 实现 ， 不 过 ， 通 过 创 
建 目 定义 的 ClassLoader， 可 以 实现 一 些 强 大 灵活 的 功能 ， 比 如 : 


1) 热 部 署 。 在 不 重启 Java 程 序 的 情况 下 ， 动 态 替 换 类 的 实现 ， 比 
如 Java Web 开 发 中 的 JSP 技 术 残 利用 目 定 义 的 ClassLoader 实 现 修改 JSP 
代码 即 生效 ，OSGI (Open Service Gateway Initiative) 框架 使 用 自 定义 
ClassLoader 实 现 动态 更 新 。 


2) 应 用 的 模块 化 和 相互 隔离 。 不同 的 ClassLoader 可 以 加 载 相同 
的 类 但 互相 隔离 、 互 不 影响。Web 应 用 服务 器 如 Tomcat 利 用 这 一 点 在 
一 个 程序 中 管理 多 个 Web 应 用 程序 ， 每 个 web 应 用 使 用 自己 的 
ClassLoader， 这 些 Web 应 用 互 不 干扰 。OSGI 和 Java 9 利用 这 一 点 实现 
了 一 个 动态 模块 化 架构 ， 每 个 模块 有 目 己 的 ClassLoader， 不 同 模块 可 
以 互 不 干扰 。 


3) 从 不 同 地 方 灵 活 加 载 。 系统 默认 的 ClassLoader 一 般 从 本 地 
的 .class 文 件 或 jar 文 件 中 加 载 字 节 码 文件 ， 通 过 上 自 定义 的 ClassLoader， 
| ` 数据 库 、 缓 存 服务 恬 等 其 他 地 方 加 载 
字 节 码 文件 。 


理解 目 定 义 ClassLoader 有 助 于 我 们 理解 这 些 系统 程序 和 框架 ， 如 
Tomat、JSP、OSGI， 在 业务 需要 的 时 候 ， 也 可 以 借助 自 定 义 
ClassLoader 实 现 动态 灵活 的 功能 。 


下 面 ， 我 们 首先 来 进一步 理解 Java 加 载 类 的 过 程 ， 理 解 类 
ClassLoader 和 Class.for-Name， 介 绍 一 个 简单 的 应 用 ， 然 后 探讨 如 何 实 
现 目 定义 ClassLoader， 演 示 如 何 利 用 它 实 现 热 部 署 。 


24.1 ”类 加 载 的 基本 机 制 和 过 程 


运行 Java 程 序 ， 就 是 执行 java 这 个 命令 ， 指 定 包 含 main 方 法 的 完整 
类 名 ， 以 及 一 个 classpath， 即 类 路 径 。 类 路 径 可 以 有 多 个 ， 对 于 直接 
的 class 文 件 ， 路 径 是 class 文 件 的 根 目 永 ， 对 于 jar 包 ， 路 径 是 jar 包 的 完 
整 名 称 〈 包 括 路 径 和 jar 包 名 ) 


Java 运 行 时 ， 会 根据 类 的 完全 限定 名 寻找 并 加 载 类 ， 寻 找 的 方式 
基本 吏 是 在 系统 类 和 指定 的 类 路 径 中 导 找 ， 如 有 宁 是 class 文 件 的 根 目 
录 ， 则 直接 查看 是 否 有 对 应 的 子 目录 及 文件 ， 如 果 是 jar 文 件 ， 则 首先 
在 内 存 中 解压 文件 ， 然 后 再 查看 是 否 有 对 应 的 类 。 


人 负 员 加 载 类 的 类 就 古 类 加 载 絮 ， 它 的 输入 古 完 全 限定 的 类 名 ， 输 
出 十 Class 对 象 。 类 加 载 器 不 是 只 有 一 个 ， 一 般 程序 运行 时 ， 都 会 有 二 
个 (适用 于 Java 9 之 前 ，Java 9 引入 了 模块 化 ， 基 本 概念 是 类 似 的 ， 但 
有 一 些 变 化 ， 限 于 篇 幅 ， 束 不 探讨 了 ) 


1) 启动 类 加 载 器 (Bootstrap ClassLoader) : 这 个 加 载 器 是 Java 
虚拟 机 实现 的 一 部 分 ， 不 是 Java 语 言 实现 的 ， 一 般 是 C++ 实现 的 ， 它 
负责 加 载 Java 的 基础 类 ， 主 要 是 <JAVA_HOME>/lib/rt.jar， 我 们 日 常用 
的 Java 类 库 比 如 String、ArrayList 等 都 位 于 该 包 内 。 


2) 扩展 类 加 载 器 (Extension ClassLoader) : 这 个 加 载 器 的 实现 
类 是 sun.misc.Laun-cher$ExtClassLoader， 它 负责 加 载 Java 的 一 些 扩展 
类 ， 一 般 是 <JAVA_HOME>/lib/ext 目 录 中 的 jar 包 。 


3) 应 用 程序 类 加 载 器 (Application ClassLoader) : 这 个 加 载 器 
的 实现 类 是 sun.misc.Launcher$AppClassLoader， 它 负责 加 载 应 用 程序 
的 类 ， 包 括 上 自己 写 的 和 引入 的 第 三 方法 类 库 ， 即 所 有 在 类 路 径 中 指定 
的 类 。 

这 三 个 类 加 载 右 有 一 定 的 关系 ， 可 以 认为 是 父子 关系 ， 
Application ClassLoader 的 父亲 是 Extension ClassLoader，Extension 的 父 


杀 是 Bootstrap ClassLoader。 注 意 不 是 父子 继承 关系 ， 而 是 父子 委派 天 
系 ， 子 ClassLoader 有 一 个 变量 parent 指 疝 父 ClassLoader， 在 子 Class- 


Loader 加 我 类 时 ， 一 般 会 首先 通过 父 ClassLoader 加 载 ， 具 体 来 说 ， 在 
加 载 一 个 类 时 ， 基 本 过 程 是 : 


1) 判断 是 否 已 经 加 载 过 了 ， 加 载 过 了 ， 直 接 返 回 Class 对 象 ， 一 
个 类 只 会 被 一 个 Class-Loader 加 载 一 次 。 


2) 如 果 没 有 被 加 载 ， 先 让 父 ClassLoader 去 加 载 ， 如 果 加 载 成 功 ， 
返回 得 到 的 Class 对 象 。 


3) 在 父 ClassLoader 没 有 加 载 成 功 的 前 担 下， 自己 尝试 加 载 类 。 


这 个 过 程 一 般 被 称 为 “双亲 委派 ” 模型， 即 优先 让 父 ClassLoader 去 
加 载 。 为 什么 要 先 让 父 ClassLoader 去 加 载 呢 ? 这 样 ， 可 以 避免 Java 类 
库 被 禾 盖 的 问题 。 比 如 ， 用 户 程序 也 定义 了 一 个 类 java.lang.String， 通 
过 双 杀 委派 ，java.lang.String 只 会 被 Bootstrap ClassLoader 加 载 ， 避 免 目 
定义 的 String 窗 盖 Java 类 库 的 定义 。 


时 需要 了 解 的 是 ,“ 双 杀 委 派 ” 虽 然 是 一 般 模 型 ， 但 也 有 一 些 例外 ， 
0: 


1) 目 定 义 的 加 载 顺 序 ， 尽管 不 被 建议 ， 目 定义 的 ClassLoader 可 

以 不 遵从 “双亲 委派 ”这 个 约定 ， 不 过 ， 即 使 不 遵从 ， 以 java 开 头 的 类 

1 这 是 由 Java 的 安全 机 制 保证 的 ， 以 避 
泌 配 。 


2) 网 状 加 载 顺 序 ， 在 OSGI 框 架 和 Java 9 模块 化 系统 中 ， 类 加 载 
磺 之 间 的 关系 是 一 个 网 ， 每 个 模块 有 一 个 类 加 载 右 ， 不 同 模块 之 间 可 
能 有 依赖 关系 ， 在 一 个 模块 加 载 一 个 类 时 ， 可 能 是 从 目 己 模 块 加 载 ， 
也 可 能 是 委派 给 其 他 模块 的 类 加 载 右 加 载 。 


3) 父 加 载 右 委派 给 子 加 载 名 加载: 典型 的 例子 有 JNDI 服 务 
(Java Naming and Directory Interface) ， 它 是 Java 企 业 级 应 用 中 的 一 
项 服务 ， 具 体 我 们 就 不 介绍 了 。 


一 个 程序 运行 时 ， 会 创建 一 个 Application ClassLoader， 在 程序 中 
用 到 ClassLoader 的 地 方 ， 如 有 果 没 有 指定 ， 一 般 用 的 都 是 这 个 
ClassLoader， 所 以 ， 这 个 ClassLoader 也 被 称 为 系统 类 加 载 句 (System 


ClassLoader) 。 下 面 ， 我 们 来 具体 看 下 表示 类 加 载 器 的 类 


ClassLoader ° 


24.2 ”理解 ClassLoader 


类 ClassLoader 是 一 个 抽象 类 ，Application ClassLoader 和 Extension 
ClassLoader 的 具体 实现 类 分 别 是 sun.misc.Launcher$AppClassLoader 和 
sun.misc.Launcher$ExtClassLoader，Bootstrap ClassLoader 不 是 由 Java 实 


现 的， 没有 对 应 的 类 。 


每 个 Class 对 象 都 有 一 个 方法 ， 可 以 获取 实际 加 载 它 的 
ClassLoader， 方 法 是 : 


public ClassLoader getClassLoader() 


ClassLoader 有 一 个 方法 ， 可 以 获取 它 的 父 ClassLoader: 


public final ClassLoader getParent() 


如 果 ClassLoader 是 Bootstrap ClassLoader， 返 回 值 为 null。 比 如 : 


public class ClassLoaderDemo { 
public static void main(String[] args) { 
ClassLoader cl = ClassLoaderDemo.class.getClassLoader(); 
while(cl != null) { 
System.out.println(cl.getCclass().getName( )); 
cl = cl.getPparent(); 


} 
System,out,println(String.class.getClassLoader() ); 


输出 为 : 


sun.misc.Launcher$AppClassLoader 
sun.misc.Launcher$ExtClassLoader 
null 


ClassLoader 有 一 个 静态 方法 ， 可 以 获取 默认 的 系统 类 加 载 吉 


public static ClassLoader getSystemClassLoader() 


ClassLoader 中 有 一 个 主要 方法 ， 用 于 加 载 类 : 


public Class<?> loadClass(String name) throws ClassNotFoundException 


比如 : 


ClassLoader cl = ClassLoader.getSystemClassLoader(); 

try { 
Class<?> cls = cl.loadClass("java.util.ArrayList"); 
ClassLoader actualLoader = cls.getCclassLoader(); 
System.out.println(actualLoader ); 

} catch (ClassNotFoundException e) { 
e.printStackTrace( ); 

} 


需要 说 明 的 是 ， 由 于 委派 机 制 ，Class 的 getClassLoader 方 法 返回 的 
不 一 定 是 调用 load-Class 的 ClassLoader， 比 如 ， 上 面 代码 中 ， 
java.util.ArrayList 实 际 由 BootStrap ClassLoader 加 载 ， 所 以 返回 值 孢 是 
null 。 


在 反射 一 章 ， 我 们 介绍 过 Class 的 两 个 静态 方法 forName: 


public static Class<?> forName(String className) 
public static Class<?> forName(String name, 
boolean initialize, ClassLoader loader) 


第 一 个 方法 使 用 系统 类 加 载 器 加 载 ， 第 二 个 方法 指定 
ClassLoader， 参 数 initialize 表 示 加 载 后 是 否 执行 类 的 初始 化 代码 (如 
static 语 句 块 ) ， 没 有 指定 默认 为 true。 


ClassLoader 的 loadClass 方 法 与 Class 的 forName 方 法 都 可 以 加 载 
类 ， 它 们 有 什么 不 同 呢 ? 基本 是 一 样 的 ， 不 过 ，ClassLoader 的 
loadClass 不 会 执行 类 的 初始 化 代码 ， 看 个 例子 : 


public class CLInitDemo { 
public static class Hello { 
static { 


System.out,println("he11o")， 


} 
}; 
public static void main(String[] args) { 
ClassLoader cl = ClassLoader.getSystemClassLoader(); 
String className = CLInitDemo.class.getName() + "$Hello",; 
try { 
Class<?> cls = cl.loadClass(classNanme); 
} catch (ClassNotFoundException e) { 
e.printStackTrace( ); 
} 


使 用 ClassLoader 加 载 静 态 内 部 类 Hello，Hello 有 一 个 static 语 人 句 
块 ， 输 出 "hello"， 运 行 该 程序 ， 类 被 加 载 了 ， 但 没有 任何 输出 ， 即 
static 语 句 块 没有 被 执行 。 如 果 将 loadClass 的 语句 换 为 : 


Class<?> cls = Class.forName(className); 


则 Jstatic 语 句 块 会 被 执行 ， 屏 幕 将 输出 "hello"。 
我 们 来 看 下 ClassLoader 的 loadClass 代 码 ， 以 进一步 理解 其 行为 : 


public Class<?> loadClass(String name) throws ClassNotFoundException f{ 
return loadClass(name, false); 
} 


它 调 用 了 男 一 个 loadClass 方 法 ， 其 主要 代码 为 (省略 了 一 些 代 
码 ， 加 了 注释 ， 以 便于 理解 ) 


protected Class<?> loadClass(String name, boolean resolve) 
throws ClassNotFoundException { 
Synchronized (getClassLoadingLock(name)) { 
// 首 先 ， 检查 类 是 否 已 经 被 加 载 了 
Class c = findLoadedClass(name); 
if(c == null) { 
// 没 被 加 载 ， 先 委派 父 ClassLoader 或 BootStrap ClassLoader 去 加 载 
try { 
if(parent != null) { 
// 委 派 父 ClassLoader，resolve 参 数 固定 为 false 
c = parent.loadCclass(name, false); 
} else { 
c = findBootstrapClassOrNull(name); 


} catch (ClassNotFoundException e) { 
// 没 找到 ， 捕 获 异常 ， 以 便 尝试 自己 加 载 


if(c == null) { 
// 自 己 去 加 载 ,，findclass 才 是 当前 ClassLoader 的 真正 加 载 方法 
c = findClass(name); 


} 


if(resolve) { 
// 链 接 ， 执 行 static 语 句 块 
resolveClass(c); 


return c; 
} 
} 


参数 resolve 类 似 Class.forName 中 的 参数 initialize， 可 以 看 出 ， 其 默 
认 值 为 false， 即 使 通过 上 自 定 义 ClassLoader 重 写 loadClass， 设 置 resolve 
为 true， 它 调用 父 ClassLoader 的 时 候 ， 传 递 的 也 是 固定 的 false 。 
findClass 是 一 个 protected 方 法 ， 类 ClassLoader 的 默认 实现 就 是 抛 出 
ClassNotFoundException， 子 类 应 该 重 写 该 方法 ， 实 现 上 自己 的 加 载 逻 
辑 ， 后 文 我 们 会 给 出 具体 例子 。 


24.3 ”类 加 载 的 应 用 :可 配置 的 打上 略 


可 以 通过 ClassLoader 的 loadClass 或 Class.forName 自 己 加 载 类 ,但 
什么 情况 需要 上 自己 加 载 类 呢 ? 很 多 应 用 使 用 面 回 接口 的 编程 ， 接 口 具 
体 的 实现 类 可 能 有 很 多 ， 适 用 于 不 同 的 场合 ， 具体 使 用 哪个 实现 类 在 
配置 文件 中 配置 ， 通 过 更 改 配置 ， 不 用 改变 代码 ， 0 
行为 ， 在 设计 模式 中 ， 这 是 一 种 策略 模式 。 我 们 看 个 简单 的 示例 ， 

义 一 个 服务 接口 IService: 


public interface IService { 
public void action(); 
} 


客户 端 通过 该 接口 访问 其 方法 ， 怎 么 获得 IService 实 例 呢 ? ul 
2 目 己 加 载 ， 使 用 反射 创建 实例 对 象 ， 示 
列 代 位 为 : 


public class ConfigurableStrategyDemo { 
public static IService createService() { 

try { 
Properties prop = new Properties(); 
String fileName = "data/c87/config,.properties"; 
prop.load(new FileInputStream(fileName)); 
String className = prop.getProperty("service"); 
Class<?> cls = Class.forName(className); 
return (IService) cls.newInstance(); 

} catch (Exception e) { 
throw new RuntimeException(e); 

} 


public static void main(String[] args) { 
IService service = createService(); 
service.action(); 
} 
} 


config.properties 的 内 容 示 例 为 : 


service=shuo.laoma.dynamic.c87.ServiceB 


代码 比较 人 简单， 就 不 资 述 了 。 完 整 代码 可 参看 
https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c87 下 。 


24.4 目 定 义 ClassLoader 


Java 类 加 载 机 制 的 强大 之 处 在 于 ， 我 们 可 以 创建 目 定 义 的 
ClassLoader， 目 定义 Class-Loader 是 Tomcat 实 现 应 用 隔离 、 文 持 JSP、 
OSGI 实 现 动态 模块 化 的 基础 。 


怎么 自 定 义 电 ?一 般 而 言 ， 继 承 类 ClassLoader， 重 写 findClass 整 
可 以 了 。 怎 么 实现 findClass 呢 ? 使 用 自己 的 逻辑 寻找 class 文 件 字 广 码 
的 字 太 形式 ， 找 到 后 ， 使 用 如 下 方法 转换 为 Class 对 象 : 


protected final Class<?> defineClass(String name, byte[] b, int off, int len) 


name 表 示 类 名 ，b 是 存放 字 万 码 数据 的 字 节 数组 ， 有 效 数 据 从 off 
开始 ， 长 度 为 len。 看 个 例子 : 


public class MyClassLoader extends ClassLoader { 
private static final String BASE DIR = "data/c87/",; 
Q@Override 
protected Class<?> findClass(String name) throws ClassNotFoundException { 
String fileName = name.replaceAll("™\\.", "/"); 
fileName = BASE DIR + fileName + ".class"; 
try { 
byte[] bytes = BinaryFileUtils.readFileToByteArray(fileName); 
return defineClass(name, bytes, 0, bytes.1length); 
} catch (IOException ex) { 
throw new ClassNotFoundException("failed to load class " + name, ex); 
} 
} 
} 


MyClassLoader 从 BASE_DIR 下 的 路 径 中 加 载 类 ， 它 使 用 了 我 们 在 
第 13 章 介绍 的 readFileToByteArray 方 法 读 取 文件 ， 转 换 为 byte 数 组 。 
MyClassLoader 没 有 指定 父 Class-Loader， 默 认 是 系统 类 加 载 器 ， 即 
ClassLoader.getSystemClassLoader () 的 返回 值 ， 不 过 ，Class-Loader 
有 一 个 可 重 写 的 构造 方法 ， 可 以 指定 父 ClassLoader: 


protected ClassLoader(ClassLoader parent) 


MyClassLoader 有 什么 用 呢 ? 将 BASE_DIR 加 人 到 classpath 中 不 就 行 

了 ， 确 实 可 以 ， 这 里 主要 是 演示 基本 用 法 ， 实 际 中 ， 可 以 从 Web 服 务 

这 就 不 是 系统 类 加 载 器 能 做 
| ， 了 了 0 


不 过 ， 不 把 BASE_DIR 放 到 classpath 中 ， 而 是 使 用 MyClassLoader 
加 载 ， 还 有 一 个 很 大 的 好 处 ， 那 惑 是 可 以 创建 多 个 MyClassLoader， 对 
同一 个 类 ， 每 个 MyClassLoader 都 可 以 加 载 一 次 ， 得 到 同一 个 类 的 不 同 
Class 对 象 ， 比 如 : 


MyClassLoader cl1 = new MyClassLoader(); 
String className = "shuo.laoma.dynamic.c87.HelloService",; 
Class<?> class1 = cl1.loadCclass(className); 
MyClassLoader cl2 = new MyClassLoader(); 
Class<?> class2 = cl2.loadCclass(className); 
If(class1 != class2) { 
System,out,println("different classes"); 
} 


cl1 和 cl2 是 两 个 不 同 的 ClassLoader，class1 和 class2 对 应 的 类 名 一 
样 ， 但 它们 是 不 同 的 对 象 。 


但 ， 这 a 到底 有 什么 用 呢 ? 


1) 可 以 实现 隔离 。 一 个 复杂 的 程序 ， 内 部 可 能 按 模块 组 织 ， 不 
同 模块 可 能 使 用 同一 个 类 ， 但 使 用 的 是 不 同 版 本 ， 如 果 使 用 同一 个 类 
加 载 器 ， 它 们 是 无 法 共存 的 ， 不 同 模块 使 用 不 同 的 类 加 载 器 就 可 以 实 
现 隔离 ，Tomcat 合 用 它 悦 次 不 同 的 Web 应 用 ，OSGI 合 用 它 岂 训 不 同和 


2) 可 以 实现 热 部 署 。 使 用 同一 个 ClassLoader， 类 只 会 被 加 载 一 
次 ， 加 载 后 ， 即 使 dlass 文 件 已 经 楼 了 ， 再 次 加 载 ， 得 到 的 也 还 是 原来 
的 Class 对 象 ， 而 使 用 MyClassLoader， 则 可 以 先 创建 一 个 新 的 
0 再 用 它 加 载 Class， 得 到 的 Class 对 象 就 是 新 的 ， 从 而 实现 
5 a 鸡 和 


下 面 ， 我 们 来 具体 看 热 部 署 的 示例 。 


~ 


24.5 目 定 义 ClassLoader 的 应 用 : 热 部 署 


所 谓 热 部 署 ， 就 是 在 不 重 局 应 用 的 情况 下 ， 当 类 的 定义 即 字 世 码 
文件 修改 后 ， 能 够 替换 该 Class 创 建 的 对 象 ， 怎 么 做 到 这 一 点 呢 ? 我 们 
利用 MyClassLoader， 看 个 人 简单 的 示例 。 


我 们 使 用 面向 接口 的 编程 ， 定 义 一 个 接口 IHelloService: 


public interface IHelloService { 
public void sayHello(); 
} 


实现 类 是 shuo.laoma.dynamic.c87.HelloImpl， class 文 件 放 到 
MyClassLoader 的 加 载 目录 中 。 


演示 类 是 HotDeployDemo， 它 定义 了 以 下 静态 变量 : 


private static final String CLASS NAME = "shuo.laoma.dynamic.c87.HelloImpl"; 
private static final String FILE NAME = "data/c87/" 

+CLASS_NAME .replaceAll(™\\.", "/")+".class",; 
private static volatile IHelloService helloService,; 


CLASS_NAME 表 示 实 现 类 名 称 ，FILE_NAME 是 具体 的 class 文 件 
路 径 ，helloService 是 IHelloService 实 例 。 


当 CLASS_NAME 代 表 的 类 字 节 码 改 变 后 ， 我 们 希望 重新 创建 
helloService， 反 映 最 新 的 代码 ， 怎 么 做 呢 ? 先 看 用 户 端 获取 
IHelloService 的 方法 : 


public static IHelloService getHelloService() { 
if(helloSservice != null) { 
return helloService,; 


synchronized (HotDeployDemo.class) { 
if(helloService == null) { 
helloService = createHelloSservice(); 


} 
return helloService,; 


} 


这 是 一 个 单 例 模式 ，createHelloService () 的 代码 为 : 


private static IHelloService createHelloService() { 
try { 
MyClassLoader cl = new MyClassLoader(); 
Class<?> cls = cl.loadClass(CLASS_ NAME); 
if(cls != null) { 
return (IHelloService) cls.newInstance(); 


} 
} catch (Exception e) { 
e.printStackTrace( ); 


return null; 


} 


它 使 用 MyClassLoader 加 载 类 ， 并 利用 反射 创建 实例 ， 它 假定 实现 
类 有 一 个 public 无 参 构造 方法 。 


在 调用 IHelloService 的 方法 时 ， 窜 户 端 总 是 移 通 过 getHelloService 
获取 实例 对 象 ， 我 们 模拟 一 个 客户 端 线程 ， 它 不 停 地 获取 
IHelloService 对 象 ， 并 调用 其 方法 ， 然 后 睡眠 1 秒 钟 ， 其 代码 为 : 


public static void client() { 
Thread t = new Thread() { 
QOverride 
public void run() { 
try { 
while (true) { 
IHelloService helloService = getHelloService(); 
helloService,.sayHello( ); 
Thread.sleep(1000); 


} catch (InterruptedException e) { 
} 
} 


}; 
t.start(); 


皇 么 知道 类 的 class 文 件 发 生 了 变化 ， 并 重新 创建 helloService 对 和 象 
呢 ? 我 们 使 用 一 个 单独 的 线程 模拟 这 一 过 程 ， 代 码 为 : 


public static void monitor() { 
Thread t = new Thread() { 


private long lastModified = new File(FILE NAME).lastModified(); 
Q@Override 


public void run() { 
try { 
while(true) { 

Thread.sleep(100); 

long now = new File(FILE NAME).lastModified(); 

if(now != lastModified) { 
lastModified = now; 
reloadHelloService(); 


} 
} catch (InterruptedException e) { 
} 
} 


}; 
t.start(); 


我 们 使 用 文件 的 最 后 修改 时 间 来 跟踪 文件 是 否 发 生 了 变化 ， 当 文 
件 修 改 后 ， 调 用 reloadHelloService () 来 重新 加 载 ， 其 代码 为 : 


public static void reloadHelloService() { 
helloService = createHelloService(); 
} 


瓯 是 利用 MyClassLoader 重 独创 建 HelloService， 创 建 后 ， 赋 值 给 
helloService， 这 样 ， 下 次 getHelloService () 获取 到 的 就 是 最 新 的 了 。 


在 主 程序 中 启动 dient 和 monitor 线 程 ， 代 码 为 : 


public static void main(String[] args) { 
monitor(); 
client(); 


在 运行 过 程 中 ， 替 换 HelloImpl.class， 可 以 看 到 行为 会 变化 ， 为 便 
于 演示 ， 我 们 在 data/c87/shuo/laoma/dynamic/c87/ 目 录 下 准备 了 两 个 不 
同 的 实现 类 : HelloImpl_origin.class 和 HelloImpl_revised.class， 在 运行 
过 程 中 替换 ， 会 看 到 输出 不 一 样 ， 如 图 24-1 所 示 。 


$ cp HelloImp\l_origin.class HelloImpl.class 
$ cp HelloImpl_revised.class HelloImpl.class 
$ cp HelloImp\l_origin.class HelloImpl.class 


hello 
hello 
hello 
hello revised 
hello revised 
hello 
hello 
hello 


图 24-1 动态 替换 实现 类 示例 


使 用 cp 命令 修改 HelloImpl.class， 如 果 其 内 容 与 
HelloImpl_origin.class 一 样 ， 输 出 为 "hello"; 如 果 与 
HelloImpl_revised.class 一 样 ， 输 出 为 "hello revised"。 


完整 的 代码 和 数据 在 github 上 ， 地 址 为 
https://github.com/swiftma/program-logic ， 位 于 包 
shuo.laoma.dynamic.c87 下 。 


本 章 介绍 了 Java 中 的 类 加 载 机 制 ， 包 括 Java 加 载 类 的 基本 过 程 ， 
类 ClassLoader 的 用 法 ， 以 及 如 何 创建 目 定 义 的 ClassLoader， 探 讨 了 两 
个 简单 应 用 示例 ， 一 个 通过 动态 加 载 实现 了 可 配置 的 策 略 ， 男 一 个 通 
过 自 定义 ClassLoader 实 现 了 热 部 署 。 


需要 说 明 的 是 ，Java 9 引入 了 模块 的 概念 。 在 模块 化 系统 中 ， 类 加 
载 的 过 程 有 一 些 变化 ， 扩 展 类 的 目录 被 删除 挤 了 ， 原 来 的 扩展 类 加 载 
器 没有 了 ， 增 加 了 一 个 平台 类 加 载 器 (Platform Class Loader) ， 角 色 
类 似 于 扩展 类 加 载 器 ， 它 分 担 了 一 部 分 启动 类 加 载 器 的 职责 ， 另 外 ， 
加 载 的 顺序 也 有 一 些 变 化 ， 限 于 篇 幅 ， 我 们 就 不 探讨 了 。 


从 第 21 章 到 本 章 ， 我 们 探讨 了 Java 中 的 多 个 动态 特性 ， 包 括 反 
射 、 注 解 、 动 态 代 理 和 类 加 载 右 ， 作 为 应 用 程序 员 ， 大 部 分 用 得 都 比 
较 少 ， 用 得 较 多 的 就 是 使 用 框架 和 库 提供 的 各 种 注解 了 ， 但 这 些 特性 


大 量 应 用 于 各 种 系统 程序 、 框 架 和 库 中 ， 理 解 这 些 特性 有 助 于 我 们 更 
好 地 理解 它们 ， 也 可 以 在 需要 的 时 候 目 己 实现 动态 、 通 用 、 灵 活 的 功 


合 巴 
月 “ 


在 注解 一 草 ， 我 们 提 到 ， 注 解 是 一 种 声明 式 编程 风格 ， 它 提高 
Java 语 言 的 表达 能 力 ， 日 第 编程 中 一 种 常见 的 需求 是 文本 处 理 ， 在 计 
算 机 科学 中 ， 有 一 种 技术 大 大 提高 了 文本 处 理 的 表达 能 力 ， 那 束 是 正 
则 表达 式 ， 大 部 分 编程 语言 都 有 对 它 的 文 持 ， 它 有 什么 强大 功能 呢 ? 
让 我 们 下 一 章 探讨 。 


第 25 章 ”正则 表达 却 


前 面 章 节 ， 我 们 提 到 了 正则 表达 式 ， 它 提升 了 文本 处 理 的 表达 能 
力 ， 本 章 束 来 讨论 正则 表达 式 ， 它 是 什么 ?” 有 什么 用 ? 各 种 特殊 字符 
都 是 什么 含义 ? 如 何 用 Java 借 助 正 则 表达 式 处 理 文 本 ? 都 有 哪些 常用 
正则 表达 式 ? 我 们 分 为 4 小 和 进行 介绍 : 25.1 市 先 简 要 介绍 正则 表达 式 
的 语法 ，25.2 节 介绍 相关 的 Java API;，25.3 节 利用 Java API 实 现 一 个 简 
单 的 模板 引擎 ，25.4 节 讨论 和 分 析 一 些 津 用 的 正则 表达 式 。 


25.1 语法 


正则 表达 陈 生 一 串 字 符 ， 它 摘 述 了 一 个 文本 模式 ， 利 用 它 可 以 方 
便 地 处 理 文本 ， 包 括 文 本 的 得 找 、 蔡 换 、 难 证 、 切 分 等 。 正 则 表达 式 
中 的 字符 有 两 类 :一 类 是 普通 字符 ， 就 是 匹配 字符 本 身 ; 男 一 类 是 元 
字符 ， 这 些 字 符 有 特殊 含义 ， 这 些 元 字符 及 其 特殊 侣 义 构成 了 正则 表 
达 式 的 语法 。 


正则 表达 式 有 一 个 比较 长 的 历史 ， 各 种 与 文本 处 理 有 天 的 工具 、 
编辑 紫 和 系统 部 支持 正则 表达 式 ， 大 部 分 编程 语言 也 都 文 持 正 则 表达 
式 。 虽 然 都 叫 正 则 表达 式 ， 但 由 于 历史 原因 ， 不 同 语言 、 系 统 和 工具 
的 语法 不 太一 样 ， 本 书 主要 针对 Java 语 言 ， 其 他 语言 可 能 有 所 差别 。 


下 面 ， 我 们 束 来 侧 要 介绍 正则 表达 式 的 语法 ， 我 们 先 分 为 以 下 部 
分 分 别 介 绍 : 


-特殊 边界 匹配 ; 

-环视 边界 匹配 。 

最 后 针对 转 义 、 匹 配 模式 和 各 种 语法 进行 总 结 。 
1 这 个 学科 

大 部 分 的 单个 字符 束 是 用 字符 本 喘 表示 的 ， 比 如 字 
符 '0'、'3'、'a'、' 马 ' 等 ,， 但 有 一 些 单个 字符 使 用 多 个 字符 表示 ， 
符 都 以 斜 杠 \ 开 头 ， 比 如 : 


1) 特殊 字符 ， 比如 tab 字 符 、 换 行 符 \m、 回 车 符 \r 等 。 


I& 
性 


2) 八进制 表示 的 字符 ， 以 \N 开 头 ， 后 跟 1 一 3 位 数字 ， 比 如 \0141， 
对 应 的 是 ASCII 编 码 为 97 的 字符 ， 即 字符 'a。 


3) 十 六 进 制 表示 的 字符 ， 以 x 开头 ， 后 跟 两 位 字符 ， 比 如 \x6A， 
对 应 的 是 ASCII 编 码 为 106 的 字符 ， 即 字符 。 


4) Unicode 编 号 表示 的 字符 ， 以 ua 开 头 ， 后 跟 4 位 字符 ， 比 如 
\u9A6C， 表 示 的 是 中 文字 符 ' 马 '， 这 只 能 表示 编号 在 0xXFFFF 以 下 的 字 
符 ， 如 果 超 出 0XFFFF， 使 用 \x{...} 形 式 ， 比 如 \x{1f48e}。 


5) 和 斜 杠 \ 本 身 ， 和 斜 杠 \ 是 一 个 元 字符 ， 如 果 要 匹配 它 自 身 ， 使 用 两 
个 冬 杠 表示 ， 即 \。 


6) 元 字符 本 号 ， 除 了 \v， 正 则 表达 式 中 还 有 很 多 元 字符 ， 比 如 .、 
*、? 、+ 等 ， 要 匹配 这 些 元 字符 自身 ， 需 要 在 前 面 加 转 义 字符 \， 比 


有 多 种 ， 包 括 任意 字符 、 多 个 指定 字符 之 一 、 字 符 区 间 、 
组、 预定 义 的 字符 组 等 ， 下 面具 体 介绍 。 

号 字符 "是 一 个 元 字符 ， 默 认 模 式 下 ， 它 匹配 除了 换行 符 以 外 的 
从 ， 比 如 正则 表达 式 : 


革 
深 

油 
Te 
有 癌 


既 匹 配 字 符 串 "abf"， 世 匹配 "acf"。 可 以 指定 另外 一 种 匹配 模式 ， 
一 般 称 为 单行 匹配 模式 或 者 点 号 匹配 模式 ， 在 此 模式 下 ,，'"… 匹 配 任意 
字 人 和 从， 包括 换行 伯 。 可 以 有 两 种 方式 指定 匹配 模式 ， 一 种 是 在 正则 表 
达 式 中 ， 以 (? s) 开头 ，s 表 示 single line， 即 单行 匹配 模式 。 比 如 : 


(?s)a.f 


另外 一 种 是 在 程序 中 指定 ， 在 Java 中 ， 对 应 的 模式 常量 是 
Pattern.DOTALEL， 下 节 我 们 再 介绍 Java API。 


在 单个 字符 和 任意 字符 之 间 ， 有 一 个 字符 组 的 概念 ， 匹 配 组 中 的 
任意 个 于 几 中 捕 号 日 表 未 比如 


[abcd] 
匹配 a、b、c、d 中 的 任意 一 个 字符 。 

[0123456789] 

匹配 任意 一 个 数字 字符 。 

为 方便 表示 连续 的 多 个 字符 ， 字 答 组 中 可 以 使 用 连 字符 -,， 比 如 


[0-9] 
[a-z] 


可 以 有 多 个 连续 空间 ， 可 以 有 其 他 普通 字符 ， 比 如 : 
[0-9a-zA-Z_ | 


在 字符 组 中 ，'- 征 一 个 元 字符 ， 如 果 要 匹配 它 自 身 ， 可 以 使 用 转 
义 ， 即 \-"， 或 者 把 它 放 在 字符 组 的 最 前 面 ， 比 如 : 


[-9-9] 


字符 组 文 持 排 除 的 概念 ， 在 [后 紧 跟 一 个 字符 ^， 比 如 : 


[Aabcd] 


表示 匹配 除了 a，b，c，d 以 外 的 任意 一 个 字符 。 


[^9-9] 


表示 匹配 一 个 非 数字 字符 。 

排除 不 且 不 能 匹配 ， 而 是 匹配 一 个 指定 字符 组 以 外 的 字符 ， 要 表 
达 不 能 匹配 的 含义 ， 需 要 使 用 后 文 介绍 的 环视 语法 。^ 只 有 在 字符 组 的 
0 
]: 


[a^b] 


束 定 匹配 字符 a，^ 或 b。 


在 字符 组 中 ， 除 了 人 ^ 信 、-、[]、\ 外 ， 其 他 在 字符 组 外 的 元 字符 不 再 具 
备 特殊 含义 ， 变 成 了 普通 字符 ， 比 如 字符 "和 ' 淡 '，[.*] 就 是 匹配 ',' 或 
者 *' 本 身 。 

有 一 些 特殊 的 以 开头 的 字符 ， 表 示 一 些 预定 义 的 字符 组 ， 比 如 : 

\d: d 表 示 digit， 死 配 一 个 数字 字符 ， 等 同 于 [0-9]。 


\w: w 表 示 word， 匹 配 一 个 单词 字符 ， 等 同 于 [a-zA-Z_0-9]。 


\S: s 表 示 space， 匹 配 一 个 空白 字符 ， 等 同 于 [nx0B\fw] 。 
它们 都 有 对 应 的 排除 型 字符 组 ， 用 大 写 表 示 ， 即 : 

\D: 匹配 一 个 非 数字 字符 ， 即 [Ad] 。 

\W: 匹配 一 个 非 单词 字符 ， 即 [AAw]。 

\S: 匹配 一 个 非 空 白字 符 ， 即 [Ns] 。 

还 有 一 类 字符 组 ， 称 为 POSIX 字 符 组 ， 它 们 是 POSIX 标 准 定 义 的 一 


些 字 和 从 组 ， 在 Java 中 ， 这 些 字 符 组 的 形式 是 \p{...}。POSIX 字 符 组 比较 
多 ， 我 们 就 不 介绍 了 。 


3. 量 词 


量词 指 的 是 指定 出 现 次 数 的 元 字符 ， 有 三 个 常见 的 元 字符 +、 
ud 


米 


1) +: 表示 前 面 字 符 的 一 次 或 多 次 出 现 ， 比 如 正则 表达 式 ab+c， 
既 能 匹配 abc， 也 能 匹配 abbc， 或 abbbc 。 


2) *: 表示 前 面 字符 的 零 次 或 多 次 出 现 ， 比 如 正则 表达 式 ab*c， 
既 能 匹配 abc， 也 能 匹配 ac， 或 abbbc。 


3) ? : 表示 前 面 字符 可 能 出 现 ， 也 可 能 不 出 现 ， 比 如 正则 表达 式 
ab? c， 既 能 匹配 abc， 也 能 匹配 ac， 但 不 能 匹配 abbc。 

更 为 通用 的 表示 出 现 次 数 的 语法 是 tm，n}， 出 现 次 数 从 m 到 n， 包 
人 如 果 n 没 有 限制 ， 可 以 省 略 ， 如 果 m 和 n 一 样 ， 可 以 写 为 {m)} ， 
比如 : 


:ab{1，10}c: b 可 以 出 现 1 次 到 10 次 。 


-ab{3}c: b 必 须 出 现 三 次 ， 即 只 能 匹配 abbbc 。 

:ab{1，}c: 与 ab+c 一 样 。 

:ab{0，}c: 与 ab*c 一 样 。 

-ab{0，1}c: 与 ab? c 一 样 。 

需要 注意 的 是 ， 语 法 必须 是 严格 的 {m，n} 形 式 ， 豆 号 左右 不 能 有 


? 、*、+、{ 是 元 字符 ， 如 果 要 匹配 这 些 字符 本 喘 ， 需 要 使 用 \ 转 
人 


a\*b 


匹配 字符 串 "a*b"。 这 些 量词 出 现在 字符 组 中 时 ， 不 是 元 字符 ， 比 
如 : 


[?*+{] 


谍 是 匹配 其 中 一 个 字符 本 身 。 


关于 量词 ， 它 们 的 默认 匹配 是 信 梦 的 ， 什 么 意思 呢 ? 看 个 例子 ， 
正则 表达 式 是 : 


<a>.*</a> 


如 条 要 处 理 的 字符 串 是 : 


<a>first</a><a>second</a> 


目的 是 想得到 两 个 匹配 ， 一 个 匹配 : 


<a>first</a> 


太 二 个 由 本 : 


<a>second</a> 


但 默认 情况 下 ， 得 到 的 结果 却 只 有 一 个 匹配 ， 匹 配 所 有 内 容 。 


这 征 因 为 .* 可 以 匹配 第 一 个 <a> 和 最 后 一 个 </a> 之 间 的 所 有 字符 ， 
只 要 能 匹配 ，.* 束 尽量 往 后 匹配 ， 它 是 信 梦 的。 如 果 硕 望 在 碰 到 第 一 个 
匹配 时 就 停止 呢 ? 应 该 使 用 懒 懈 量词 ， 在 量词 的 后 面 加 一 个 符号 '? '， 
针对 上 例 ， 将 表达 式 改 为 : 


<a>.*?</a> 


束 能 得 到 期 鹿 的 结果 。 所 有 量词 都 有 对 应 的 懒 悄 形 式 ， 比 如 : 


xX? ? ~、Xx*? 、X+? 、Xx{m,，n}? 等 。 


表达 式 可 以 用 括号 () 括 起 来 ， 表 示 一 个 分 组 ， 比 如 a (bc) d,， bc 
就 是 一 个 分 组 。 分 组 可 以 嵌 套 ， 比 如 a (de (fg) ) 。 分 组 默认 都 有 一 
个 编号 ， 按 照 括 号 的 出 现 顺序 ， 从 1 开始 ， 从 左 到 右 依次 递增 ， 比 如 表 


I 


a(bc)((de)(fg)) 


字符 串 abcdefg 匹 配 这 个 表达 式 ， 第 1 个 分 组 为 bc， 第 2 个 为 defg， 第 
3 个 为 de， 第 4 个 为 fg。 分 组 0 是 一 个 特殊 分 组 ， 内 容 是 整个 匹配 的 字符 
串 ， 这 里 是 abcdefg 。 


分 组 匹配 的 子 字 符 串 可 以 在 后 续 访 问 ， 好 像 被 捕获 了 一 样 ， 所 以 
。 天 于 如 何在 Java 中 访问 和 使 用 捕获 分 组 ， 我 们 
了 HHy729” 


可 以 对 分 组 使 用 量词 ， 表 示 分 组 的 出 现 次 数 ， 比 如 a (bc) +d， 表 
示 bc 出 现 一 次 或 多 次 。 


中 括号 [] 表 示 匹 配 其 中 的 一 个 字符 ， 插 号 () 和 元 字符 一起， 可 
以 表示 匹配 其 中 的 一 个 子 表 达 式 ， 比 如 : 


(http|ftp|file) 

匹配 http 或 ftp 或 file 。 

需要 注意 区 分 | 和 口 ，| 用 于 口中 不 再 有 特殊 含义 ， 比 如 : 
[alb] 


它 的 含义 不 是 匹配 a 或 b， 而 是 a 或 | 或 b。 


在 正则 表达 式 中 ， 可 以 使 用 斜 杠 \ 加 分 组 编号 引用 之 前 匹配 的 分 
组 ， 这 称 为 回溯 引用 ， 比 如 : 


<(\w+)>(.*)</\1> 


AI 匹配 之 前 的 第 一 个 分 组 (w+) ， 这 个 表达 式 可 以 匹配 类 似 如 下 


字符 串 : 

<title>bc</title> 

这 里 ， 第 一 个 分 组 是 "title" 。 

使 用 数字 引用 分 组 ， 可 能 容易 出 现 混 乱 ， 可 以 对 分 组 进行 命名 ， 
通过 名 字 引 用 之 前 的 分 组 ， 对 分 组 命名 的 语法 是 (? <name>X) ， 引 | 
用 分 组 的 语法 是 \k<name>， 比 如 ， 上 面 的 例子 可 以 写 为 : 


<(?<tag>\w+)>(.*)</\k<tag>> 


默认 分 组 痢 称 为 捕获 分 组 ， 即 分 组 匹配 的 内 容 被 捕获 了 ， 可 以 在 


后 续 被 引用 。 实 现 捕获 分 组 有 一 定 的 成 本 ， 为 了 提高 性 能 ， 如 有 果 分 组 
Fo 可 以 改 为 非 捕获 分 组 ， 语 法 是 (? : ...) ， 比 
0: 

(?:abc |def) 
5. 特 殊 边 界 匹配 


在 正则 表达 式 中 ， 除 了 可 以 指定 字符 需 满足 什么 条 件 ， 还 可 以 指 
定 字 符 的 边界 需 满 足 什 么 条 件 ， 或 者 说 匹配 特定 的 边界 ， 常 用 的 表示 
特殊 边 界 的 元 字符 有 ^、$、\\A、\XZ、 和 \b。 


默认 情况 下 ，^ 匹 配 整个 字符 串 的 开始 ，Aabc 表 示 整 个 字符 串 必 须 
以 abc 开 始 。 


需要 注意 的 是 ^ 的 含义 ， 在 字符 组 中 它 表 示 排 除 ， 但 在 字符 组 外 ， 
0 比如 表达 式 ^[^abc]， 表 示 以 一 个 不 是 a、b、c 的 字符 开 
台 。 
_ 默认 情 次 下 ，$ 匹 配 整 个 字符 由 的 线束， 不过， 如 采 整 个 字符 串 以 
换行 符 结 束 ，$ 匹 配 的 是 换行 符 之 前 的 边界 ， 比 如 表达 式 abc$， 表 示人 整 
个 表达 式 以 abc 结 束 ， 或 者 以 abao\rn 或 abcn 结 束 。 


以 上 ^A 和 $ 的 含义 是 默认 模式 下 的 ， 可 以 指定 另外 一 种 匹配 模式 : 
多 行 匹 配 模式 ， 在 此 模式 下 ， 会 以 行为 单位 进行 匹配 ，^ 匹 配 的 是 行 开 
始 ，$ 匹 配 的 是 行 结束 ， 比 如 表达 式 是 Aabc$， 字 符 串 是 "abcvnabcNrn'"， 
就 会 有 两 个 匹配 。 


可 以 有 两 种 方式 指定 匹配 模式 。 一 种 是 在 正则 表达 式 中 ， 以 (? 
2 m 表 示 multi-line， 即 多 行 匹 配 模式 ， 上 面 的 正则 表达 式 可 以 
与 力 : 


(?m)^abc$ 


另外 一 种 是 在 程序 中 指定 ， 在 Java 中 ， 对 应 的 模式 常量 是 
Pattern.MULTILINE， 下 节 我 们 再 介绍 Java API。 


需要 说 明 的 是 ， 多 行 模式 和 之 前 介绍 的 单行 模式 容易 混 消 ， 其 
实 ， 它 们 之 间 没 有 关系 。 单 行 模式 影响 的 是 子 符 "的 匹配 规则 ， 使 
得 '.' 可 以 匹配 换行 符 ; 多 行 模式 影响 的 是 \ 和 $ 的 匹配 规则 ， 使 得 它们 可 
以 匹配 行 的 开始 和 结束 ， 两 个 模式 可 以 一 起 使 用 。 

\A 与 ^ 类 似 ， 但 不 管 什 么 模式 ， 它 匹配 的 总 是 整个 字符 串 的 开始 边 
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这 和 \z 与 $ 类 似 ， 但 不 省 什 么 模式 ， 它 们 匹配 的 忌 古 整个 字符 串 的 
结束 边界 。\zZ 与 的 区 别 是 :如 果子 符 串 以 换行 符 结 束 ，\zZ 与 $ 一 样 ， 
匹配 的 是 换行 符 之 前 的 边界 ， 而 \z 匹 配 的 总 是 结束 边界 。 在 进行 输入 验 
0 


匹配 的 是 单词 边界 ， 比 如 \bcatb， 匹 配 的 是 完整 的 单词 cat， 它 不 
能 匹配 category。Y 匹 配 的 不 是 一 个 具体 的 字符 ， 而 是 一 种 边界 ， 这 种 
边界 满足 一 个 要 求 ， 即 一 边 是 单词 字符 ， 另 一 边 不 是 单词 字符 。 在 
Java 中 ，b 识 别 的 单词 字符 除了 \w， 还 包括 中 文字 符 。 


边界 匹配 可 能 难以 理解 ， 我 们 解释 下 。 边 界 匹 配 不 同 于 字符 匹 
配 ， 可 以 认为 ， 在 一 个 字符 串 中 ， 每 个 字符 的 两 边 都 是 边界 ， 而 上 面 
介绍 的 这 些 特殊 字符 ， 匹 配 的 都 不 是 字符 ， 而 是 特定 的 边界 ， 看 个 例 
子 ， 如 图 25-1 所 示 。 


\A vv 
\b \b 


图 25-1 边界 匹配 示例 


上 面 的 字符 串 是 "a cat\n"， 我 们 用 粗 线 显示 出 了 每 个 字符 两 边 的 边 
界 ， 并 且 显 示 出 了 每 个 边界 与 哪些 边 和 界 元 字符 匹配 。 


6. 环 视 边界 匹配 


对 于 边界 匹配 ， 除 了 使 用 上 面 介绍 的 边界 元 字符 ， 还 有 一 种 更 为 
通用 的 方式 ， 那 就 是 环视 。 环 视 的 字面 意思 就 是 左右 看 看 ， 需 要 左右 
符合 一 坚 条 件 ， 本 质 上 ， 它 也 是 匹配 这 和 草 ;， 对 边 弄 有 一 些 要 求 ， 这 个 
要 求 是 针对 左边 或 右边 的 字符 串 的 。 根 据 要 求 不 同 ， 分 为 4 种 环视 : 


1) 肯定 顺序 环视 ， 语法 是 (? =...) ， 要 求 右边 的 字符 串 匹 配 指 
定 的 表达 式 。 比 如 表达 式 abc (? =def) ， (? =def) 在 字符 c 右 面 ， 即 
匹配 c 右 面 的 边界 。 对 这 个 边界 的 要 求 是 : 它 的 右边 有 def， 比 如 
abcdef， 如 果 没 有 ， 比 如 abcd， 则 不 匹配 。 


2) 否定 顺序 环视 ， 语 法 是 〈? ! ...) ， 要 求 右边 的 字符 串 不 能 
配 指定 的 表达 式 。 比 如 表达 式 s (? ! ing) ， 匹 配 一 般 的 s， 但 不 匹配 
后 面 有 ing 的 sS。 注 意 : 避免 与 排除 型 字符 组 混 消 ， 比 如 s[Aing]，s[Aing] 
匹配 的 是 两 个 字符 ， 第 一 个 是 s， 第 二 个 是 i、n、g 以 外 的 任意 一 个 字 
符 。 

3) 肯定 逆序 环视 ， 语 法 是 〈? <=...) ， 要 求 左边 的 字符 串 匹 配 指 
定 的 表达 式 。 比 如 表达 式 (? <=\s) abc， (? <=\s) 在 字符 a 左 边 ， 即 
匹配 a 左边 的 边界 。 对 这 个 边界 的 要 求 是 ， 它 的 左边 必须 是 空 日 字符 。 


4) 否定 逆序 环视 ， 语 法 是 (? <! ...) ， 要 求 左 边 的 字符 串 不 能 
匹配 指定 的 表达 式 。 比 如 表达 式 (? <! \w) cat，(? <1 \w) 在 字符 c 


左边 ， 即 匹配 c 左 边 的 边界 。 对 这 个 边界 的 要 求 是 ， 它 的 左边 不 能 十 单 
字 


词 字符 。 


可 以 看 出 ， 环 视 也 使 用 括号 () ， 不 过 ， 它 不 是 分 组 ， 不 占用 分 
组 编号 。 


这 些 环 视 结构 也 被 称 为 断言 ， 断 言 的 对 象 是 边界 ， 边 界 不 占用 字 
符 ， 没 有 视 度 ， 所 以 也 被 称 为 零 宽 度 断 言 。 


顺序 环视 也 可 以 出 现在 左边 ， 比 如 表达 式 : 


(?=.*[A-Z] )Nw+ 


这 个 表达 式 是 什么 意思 呢 ? \w+ 匹 配 多 个 单词 字符 ， (? =.*[A- 
Z]) 匹配 单词 字符 的 左边 界 ， 这 是 一 个 肯定 顺序 环视 。 对 这 个 边界 的 
要 求 是 ， 它 右边 的 字符 串 匹 配 表 达 式 .: 


.*[A-Z] 


也 就 是 说 ， 它 右边 至 少 要 有 一 个 大 写字 母 。 
逆序 环视 也 可 以 出 现在 右边 ， 比 如 表达 式 ; 


[\w.]+(?<!\.) 


[w.]+ 死 配 单词 字符 和 字符 '…' 构 成 的 字符 串 ， 比 如 "hello.ma"。 (? 
<! \) 匹配 字符 串 的 右边 界 ， 这 是 一 个 逆序 否定 环视 。 对 这 个 边界 的 
要 求 是 : 它 左 边 的 字符 不 能 是 …， 也 就 是 说 ， 如 果 字 符 串 以 .结尾 ， 则 
匹配 的 字符 串 中 不 能 包括 这 个 …。 比 如 ， 如 果 字 符 串 是 "hello.ma."， 则 
匹配 的 子 字 符 串 是 "hello.ma" 。 


环视 匹配 的 是 一 个 边界 ， 里 面 的 表达 式 是 对 这 个 边 弄 左边 或 右边 


字符 串 的 要 求 ， 对 同一 个 边界 ， 可 以 指定 多 个 要 求 ， 即 写 多 个 环视 ， 
比如 表达 去 


(?=.*[A-Z])(?=.*[9-9])Nw+ 


\w+ 的 左边 界 有 两 个 要 求 ， (? =.*[A-Z]) 要 求 后 面 至 少 有 一 个 大 
写字 母 ，(? =.*[0-9]) 要 求 后 面 至 少 有 一 位 数字 。 


7. 转 义 与 匹配 模式 

我 们 知道 ， 字 符 \ 表 示 转 义 ， 转 义 有 两 种 。 

1) 把 普通 字符 转 义 ， 使 其 具备 特殊 含义 ， 比 
如 \t、Nn、 Ad、\wN、\b、 AAA 等 ， 也 驶 是 说 ， 这 个 转 义 把 普通 字符 要 
河 丁 元 吾 何 “ 


2) 把 元 字符 转 义 ， 使 其 变 为 普通 字符 ， 比如 \'、 和 ww 、\? '、\ 
( x 等 


记 住所 有 的 元 字符 ， 并 在 需要 的 时 候 进 行 转 义 ， 这 是 比较 困难 


的 ， 有 一 个 简单 的 办 法 ， 可 以 将 所 有 元 字符 看 作 普 通 字 符 ， 就 是 在 开 
处 加 上 \Q， 在 结束 处 加 上 \E， 比 如 : 


\Q(.*+)\E 


\Q 和 \E 之 间 的 所 有 字符 都 会 被 视 为 普通 字符 。 


正则 表达 式 用 字符 串 表示 ， 在 Java 中 ， 字 符 \' 也 是 字符 串 语法 中 的 
元 字符 ， 这 使 得 正则 表达 式 中 的 \， 在 Java 字 符 串 表示 中 ， 要 用 两 
个 \， 即 W， 而 要 匹配 字符 \ 本 身 ， 在 Java 字 符 串 表示 中 ， 要 用 4 个 \， 
即 NWWW， 关 于 这 点 ， 下 节 我 们 会 进一步 说 明 。 

前 面 提 到 了 两 种 匹配 模式 ， 还 有 一 种 常用 的 匹配 模式 ， 就 是 不 区 


分 大 小 写 的 模式 ， 指 定 方式 也 有 两 种 。 一 种 是 在 正则 表达 式 开 头 使 用 
(? i ，i 为 ignore， 比 如 : 


(?i)the 


既 可 以 匹配 the， 也 可 以 匹配 THE， 还 可 以 匹配 The。 匹 配 模式 也 可 
以 在 程序 中 指定 ，Java 中 对 应 的 变量 是 Pattern.CASE_INSENSITIVE 。 


需要 说 明 的 是 ， 匹 配 模式 间 不 是 互 斤 的 关系 ， 它 们 可 以 一 起 使 用 ， 在 
正则 表达 式 中 ， 可 以 指定 多 个 模式 ， 比 如 (? smi) 。 


8. 语法 避 第 


下 面 ， 我 们 用 表格 的 形式 简要 汇总 下 正则 表达 式 的 语法 ， 如 表 25-1 
到 表 25-6 所 示 。 


表 25-1 单个 字符 语法 


语 法 解 释 
r-\n\t 基本 Unicode 字符 ,如 \u9A6C ( 马 ) 
\On 、\Onn 、\Omnn 八进制 字符 ， 如 \0141 \x{h...h} 增补 Unicode 字符 ， 如 \x{1f48e} 
\xhh 六 进 制 字 符 ， 如 \x6A 
语 法 解 释 
默认 模式 是 换行 符 外 的 任意 字符 ， se ne EN 
行 模式 a NE 0 到 9、a 到 z 的 任意 一 个 字符 
天 共生 证 忌 < 
[abc] a、b、c 中 的 任意 一 个 字符 -0- 0 到 9 或 者 连 字 符 - 
[^abc] a、b、c 以 外 的 任意 一 个 字符 . .或 者 *， 没 有 特殊 含义 
( 续 ) 
语 法 解 释 
[a-z&&[^de]] a 到 z, 但 不 包括 d 和 e \ [^\d] 
[[abe][def]] [入 wj] 
a [9 
Ww POSIX 字符 组 
\s 
三 二 五 、 
表 25-3 ”量词 语法 
语 法 
X 出现 0 次 或 1 次 
冯 ?9、 去 997 es i 1 次 x{m,n} 、x{m,n}? 
.0 xx 出现 0 次 或 多 次 
二 FA 流沙 7 x 出 现 1 次 或 多 次 


表 25-4 分 组 语法 


给 分 组 命名 ， 比 如 <(?<tag>\Vw+)>， 
(w+) 匹配 的 分 组 命名 为 了 tag 
引用 命名 分 组 ， 


(.*)<AM\k<tag>> 


ablcd 匹配 ab 或 cd (?<name>X) 


Wg 七 如 <(?<tag>\w+)> 
(httplftplfile) 匹配 http 、ftp 或 file \k<name> en aap 


a(bc)+d bc 作为 一 个 分 组 出 现 多 次 (?:abcldef) 分 组 但 不 捕获 ， 匹 配 abc 或 def 
Cw+) 捕获 第 一 个 分 组 ，\1 回溯 引 
用 该 分 组 


< (w+)>(.#)< 八 1> 


表 25-5 ”边界 和 环视 语法 


语 法 解 释 
默认 模式 是 整个 字符 串 的 开始 边界 ， 多 行 模式 是 行 的 开始 边界 
默认 模式 是 整个 字符 串 的 结束 边界 ， 多 行 模式 是 行 的 结束 边界 ， 如 果 结 尾 是 换行 符 ， 为 换行 符 之 


前 的 边 界 
\A 总 是 匹配 整个 字符 串 的 开始 边界 
WW 总 是 匹配 整个 字符 串 的 结束 边界 ， 如 果 结 尾 是 换行 符 ， 匹 配 换行 符 之 前 的 边界 
\z 总 是 匹配 整个 字符 串 的 结束 边界 ， 不 管 结尾 是 否 是 换行 符 
\b 匹配 单词 边界 ,边界 一 边 是 单词 字符 ， 另 一 边 不 是 
Qs. 肯定 顺序 环视 ， 匹 配 边界 ， 该 边界 右边 的 字符 串 匹 配 指定 表达 式 
(天 =. 否定 顺序 环视 ， 匹 配 边界 ， 该 边界 右边 的 字符 串 不 能 匹配 指定 表达 式 
Le) 肯定 逆序 环视 ,匹配 边界 ， 该 边界 左边 的 字符 串 匹 配 指定 表达 式 
(a. 否定 逆序 环视， 匹配 边界 ， 该 边界 左边 的 字符 串 不 能 匹配 指定 表达 式 


表 25-6 ”匹配 模式 和 转 义 语法 


不 区 分 大 小 写 匹 配 


多 行 模式 ,^ 匹配 行 开 始 ，$ 匹配 行 结 
单行 模式 ，. 匹配 任意 字符 ， 包 括 换行 符 


25.2 Java API 


正则 表达 式 相 关 的 类 位 于 包 java.util.regex 下 ， 有 两 个 主要 的 类 ， 
一 个 是 Pattermn， 男 一 个 是 Matcher。Pattern 表 示 正 则 表达 式 对 象 ， 它 与 
要 处 理 的 具体 字符 囊 无 关 。Matcher 表 示 一 个 匹配 ， 它 将 正则 表达 式 应 
用 于 一 个 具体 字符 串 ， 通 过 它 对 字符 串 进 行 处 理 。 


字符 串 类 String 也 是 一 个 重要 的 类 ， 我 们 之 前 专门 介绍 过 String,， 
其 中 所 到 ， 它 有 一 些 方法 ， 接 受 的 参数 不 是 普通 的 字符 串 ， 而 是 正则 
表达 式 。 此 外 ， 正 则 表达 式 在 Java 中 是 需要 先 以 字符 串 形 式 表 示 的 。 


下 面 ， 我 们 移 来 介绍 如 何 表示 正则 表达 式 ， 然 后 探讨 如 何 利用 它 
实现 一 些 常 见 的 文本 处 理 任务 ， 包 括 切 分 、 验 证 、 查 找 和 奉 换 。 


1. 表 示 正 则 表达 式 


正则 表达 式 由 元 字符 和 普通 字符 组 成 ， 字 符 \ 和 是 一 个 元 字符 ， 要 
在 正则 表达 式 中 表示 \ 本 身 ， 需 要 使 用 它 转 义 ， 即 淮 。 


在 Java 中 ， 没 有 什么 特殊 的 语法 能 直接 表示 正则 表达 式 ， 需 要 用 
字符 串 表 示 ， 而 在 字符 串 中 ，N 也 是 一 个 元 字符 ， 为 了 在 字符 串 中 表 
示 正 则 表达 式 的 \， 就 需要 使 用 两 个 \， 即 只 ， 而 要 匹配 \ 本 身 ， 就 需 
要 4 个 NV， 即 W。 比 如 ， 如 下 表达 式 : 


<(\w+)>(.*)</\1> 


对 应 的 字符 串 表示 束 是 : 


"< (NW)>(.*) /NL>" 


一 个 位 单 规则 是 ， 正 则 表达 式 中 的 任何 一 个 \， 在 字符 串 中 ， 需 
要 替换 为 两 个 \。 


字符 串 表示 的 正则 表达 式 可 以 被 编译 为 一 个 Pattermn 对 象 ， 比 如 : 


String regex = "<(\AXw+)>(.*)</ NANX1>"， 
Pattern pattern = Pattern.compile(regex); 


Pattern 是 正则 表达 式 的 面 问 对 象 表示 ， 所 谓 编译 ， 人 简单 理 解 承 是 
将 字符 串 表 示 为 了 一 个 内 部 结构 ， 这 个 结构 是 一 个 有 穷 目 动机 “。 关 于 
有 和 穷 目 动机 的 理论 比较 深入 ， 我 们 束 不 探讨 了 。 

编译 有 一 定 的 成 本 ， 而 且 Pattern 对 象 只 与 正则 表达 式 有 关 ， 与 要 
处 理 的 具体 文本 无 关 ， 它 可 以 安全 地 被 多 线程 共享 ， 所以， 在 使 用 同 


一 个 正则 表达 式 处 理 多 个 文本 时 ， 应 该 尽量 重用 同一 个 Pattem 对 象 
避免 重复 编译 。 


Pattern 的 compile 方 法 接受 一 个 额外 参数 ， 可 以 指定 匹配 模式 : 


public static Pattern compile(String regex, int flags) 


上 节 ， 我 们 介绍 过 三 种 匹配 模式 ， 单行 模式 (点 号 模式 ) 、 多 行 
模式 和 大 小 写 无 关 模 式 ， 它 们 对 应 的 常量 分 别 为 : Pattern.DOTALL 、 
Pattern.MULTILINE 和 Pattern.CASE_INSENSI-TIVE， 多 个 模式 可 以 一 
起 使 用 ， 通 过 '! 连 起 来 即 可 ， 如 下 所 示 : 


Pattern,.compile(regex，Pattern,CASE_INSENSITIVE | Pattern.DOTALL) 


还 有 一 个 模式 Pattern.LITERAL， 在 此 模式 下 ， 正 则 表达 式 字 符 串 
的 元 字符 将 失去 特殊 含义 ， 被 看 作 普 通 字符 。Pattern 有 一 个 静态 方 
疾 : 


public static String quote(String s) 


quote () 的 目的 是 类 似 的 ， 它 将 s 中 的 字符 都 看 作 普 通 字 符 。 我 
们 在 上 节 介 绍 过 \Q 和 \E，\Q 和 和 \E 之 间 的 字符 会 被 视 为 普通 字符 。guote 
() 基本 上 就 是 在 字符 串 s 的 前 后 加 了 \Q 和 \E， 比 如 ， 如 果 s 
为 "Nd{6}"， 则 quote () 的 返回 值 就 是 "NQNd{6}NE" 。 


>. 切 分 


文本 处 理 的 一 个 利 见 需求 是 根据 分 隅 符 切 分 字符 串 ， 比 如 在 处 理 
CSV 文 件 时 ， 按 喜 号 分 隔 每 个 字段 ， 这 个 需求 听 上 去 很 容易 满足 ， 因 
为 String 类 有 如 下 方法 : 


public String[] split(String regex) 


比如 : 


String str = "abc, def,hello"; 
String[] fields = str.split(","); 


不 过 ， 有 一 些 重要 的 细节 ， 我 们 需要 注意 。 
split 将 参数 regex 看 作 正 则 表达 式 ， 而 不 是 普通 的 字符 ， 如 果 分 隅 


符 是 元 字符 ， 比 如 .$| () [{A? *+\， 就 需要 转 义 。 比 如 按 点 号 ,分隔 ， 
需要 写 为 


String[] fields = str.split("\\."); 


如 果 分 隔 符 是 用 户 指 定 的 ， 程 序 事先 不 知道 ， 可 以 通过 
Pattern.quote () 将 其 看 作 普 通 字符 串 。 


既然 是 正则 表达 式 ， 分 隔 符 就 不 一 定 是 一 个 字符 ， 比 如 ， 可 以 将 
一 个 或 多 个 空白 字符 或 点 号 作为 分 隔 符 ， 如 下 所 示 ; 


String str = "abc def hello.\n world"; 
String[] fields = str.split("[\\s.]+"); 


fields 内 容 为 : 


[abc, def, hello, world] 


需要 说 明 的 是 ， 尾 部 的 空 日 子 符 串 不 会 包含 在 返回 的 结 采 数组 
中 ， 但 头 部 和 中 间 的 空 日 字符 串 会 被 包含 在 内 ， 比 如 : 


String str = ",abc,,def,,"; 

String[] fields = str.split(","); 
System,out,println("field num: "+fields.1length); 
System,.out,println(Arrays.toString(fields) )， 


输出 为 : 


field num: 4 
[, abc, , def] 


如 有 果 字 符 串 中 找 不 到 匹配 regex 的 分 隔 符 ， 返 回 数组 长 度 为 1， 元 
素 为 原 字 符 串 。 


Pattern 也 有 split 方 法 ， 与 String 方 法 的 定义 类 似 : 


public String[] split(CharSequence input ) 


与 String 方 法 的 区 别 如 下 。 


1) Pattern 接 受 的 参数 是 CharSequence， 更 为 通用 ， 我 们 知道 
String、StringBuilder、StringBuffer、CharBuffer 等 都 实现 了 该 接口 。 


2) 如 果 regex 长 度 大 于 1 或 包含 元 字符 ，String 的 split 方 法 必须 先 将 
regex 编 译 为 Pattern 对 象 ， 再 调用 Pattern 的 split 方 法 ， 这 时 ， 为 避免 重 
复 编 译 ， 应 该 优先 采用 Pattern 的 方法 。 


3) 如 条 regex 束 是 一 | 字符 且 不 是 元 字符 ，String 的 split 方 法 会 采 
用 更 为 简单 高 效 的 实现 ， 所 以 ， 这 时 应 该 优先 采用 String 的 split 方 法 。 


3 验证 


验证 就 古 检验 输入 文本 是 否 完整 匹配 预定 义 的 正则 表达 式 ， 经 常 
用 于 检验 用 户 的 输入 是 否 合法 。String 有 如 下 方法 : 


public boolean matches(String regex) 


比如 : 


String regex = "\\d{8}"; 
String str = "12345678"，; 
System.out.println(str.matches(regex)); 


检查 输入 是 否 是 8 位 数 子 ， 输 出 为 true 。 


String 的 matches 实 际 调用 的 是 Pattern 的 如 下 方法 : 


public static boolean matches(String regex, CharSequence input) 


这 是 一 个 静态 方法 ， 它 的 代码 为 : 


public static boolean matches(String regex, CharSequence input) { 
Pattern p = Pattern.compile(regex); 
Matcher m = p.matcher(input); 
return m.matches(); 


就 是 移 调 用 compile 编 译 regex 为 Pattern 对 象 ， 再 调用 Pattern 的 
matcher 方 法 生成 一 个 匹配 对 象 Matcher，Matcher 的 matches 方 法 返回 是 
人 否 完 整 匹 配 。 

4. 查 找 


查找 束 是 在 文本 中 寻找 匹配 正则 表达 式 的 子 字 符 串 ， 看 个 例子 : 


public static void find(){ 
String regex = "\\d{4}-\\d{2}-\\d{2}"; 
Pattern pattern = Pattern.compile(regex); 
String str = "today is 2017-06-02, yesterday is 2017-06-01"; 
Matcher matcher = pattern.matcher(str); 
while(matcher.find()){ 
System.out,println("find "+matcher.group() 
+" position: "+matcher.start()+"-"+matcher.end()); 


代码 寻找 所 有 类 似 "2017-06-02" 这 种 格式 的 日 期 ， 输 出 为 : 


find 2017-06-02 position: 9-19 
find 2017-06-01 position: 34-44 


Matcher 的 内 部 记录 有 一 个 位 置 ， 起 始 为 0，find 方 法 从 这 个 位 置 查 
找 匹 配 正则 表达 式 的 子 字 符 串 ， 找 到 后 ， 返 回 tme， 并 更 新 这 个 内 部 
位 置 ， 匹 配 到 的 子 字 符 串 信息 可 以 通过 如 下 方法 获取 : 


// 匹 配 到 的 完整 子 字符 串 
public String group() 

// 子 字符 串 在 整个 字符 串 中 的 起 始 位 
public int start() 
// 子 字符 串 在 整个 字符 串 中 的 结束 位 置 加 1 
public int end() 


group () 其 实 调用 的 是 group (0) ， 表 示 获 取 匹 配 的 第 0 个 分 组 
的 内 容 。 我 们 在 上 节 介绍 过 捕获 分 组 的 概念 ， 分 组 0 是 一 个 特殊 分 组 ， 
表示 匹配 的 整个 子 字 符 串 。 除 了 分 组 0，Matcher 还 有 如 下 方法 ， 获 取 
分 组 的 更 多 信息 : 


/分 组 个 数 
public int groupCount() 


// 分 组 编号 为 group 的 内 容 

public String group(int group) 
// 分 组 命名 为 name 的 内 容 

public String group(String name) 
// 分 组 编号 为 group 的 起 始 位 

public int start(int group) 

// 分 组 编号 为 group 的 结束 位 置 加 1 


public int end(int group) 


比如 : 


public static void findGroup() { 
String regex = "(\\d{4})-(\\d{2})-(\\d{2})",; 
Pattern pattern = Pattern.compile(regex); 
String str = "today is 2017-06-02, yesterday is 2017-06-01"; 
Matcher matcher = pattern.matcher(str),; 
while (matcher.find()) { 
System.out.println("year:" + matcher.group(1) 
+ ",month:" + matcher.group(2) + ",day:" + matcher.group(3)); 


输出 为 : 


year :2017,month:06,day:02 
year:2017,month:06,day:01 


We 一 个 营 见 的 后 续 操 作 是 蔡 换 。String 有 多 个 等 
去 


public String replace(char oldChar, char newChar ) 

public String replace(CharSequence target, CharSequence replacement) 
public String replaceAll(String regex, String replacement) 

public String replaceFirst(String regex, String replacement) 


第 一 个 replace 方 法 操作 的 是 单个 字符 ， 第 二 个 是 CharSequence， 
它们 都 是 将 参数 看 作 普 通 字 符 。 而 replaceAl 和 replaceFirst 则 将 参数 
regex 看 作 正 则 表达 式 ， 它 们 的 区 别 是 ，replaceAl 奉 换 所 有 找到 的 子 字 
符 串 ， 而 replaceFirst 则 只 替换 第 一 个 找到 的 。 看 个 简单 的 例子 ， 将 字 
符 串 中 的 多 个 连续 衬 日 字符 替换 为 一 个 : 


String regex = "\\s+t"; 
String str = "hello world good"; 
System.out.println(str.replaceAll(regex, " ")); 


输出 为 : 


hello world good 


在 replaceAll 和 replaceFirst 中 ， 参 数 replacement 也 不 是 被 看 作 普 通 
的 字符 串 ， 可 以 使 用 美元 符号 加 数字 的 形式 (比如 $1) 引用 捕获 分 
组 。 我 们 看 个 例子 : 


String regex = "(\\d{4})-(\\d{2})-(\\d{2})"; 
String str = "today is 2017-06-02."; 
System,.out.println(str.replaceFirst(regex, "$1/$2/$3")); 


输出 为 : 
today is 2017/06/02 ， 


这 个 例子 将 找到 的 日 期 字符 串 的 格式 进行 了 转换 。 所 以 ， 字 
符 '$ 在 replacement 中 十 元 字符 ， 如 采 需 要 蔡 换 为 字符 '$ 本 号， 需要 使 
用 统 关 ”有 全 例 于 ， 


String regex = "#"， 
String str = "#this is a test"; 
System.out.println(str.replaceAll(regex, "\\$")); 


如 有 果 替 换 字 符 串 是 用 户 提 供 的 ， 为 避免 元 字符 的 干扰 ， 可 以 使 用 
Matcher 的 如 下 静态 方法 将 其 视 为 普通 字符 串 : 


public static String quoteReplacement(String s) 


String 的 replaceAll 和 replaceFirst 调 用 的 其 实 是 Pattern 和 Matcher 中 的 
方法 。 比 如 ，replaceAl 的 代码 为 : 


public String replaceAll(String regex, String replacement) { 
return Pattern.compile(regex).matcher(this).replaceAll(replacement); 


replaceAl1 和 replaceFirst 都 定义 在 Matcher 中 ， 除 了 一 次 性 的 替换 操 
作 外 ，Matcher 还 定义 了 边 碍 找 、 边 替换 的 方法 ; 


public Matcher appendReplacement(StringBuffer sb, String replacement) 
public StringBuffer appendTail(StringBuffer sb) 


这 两 个 方法 用 于 和 find () 一 起 使 用 ， 我 们 先 看 个 例子 : 


public static void replaceCat() { 
Pattern p = Pattern.compile("cat"),; 
Matcher m = p.matcher("one cat, two cat, three cat"); 
StringBuffer sb = new StringBuffer(); 
int foundNum = 0; 


while(m.find()) { 
m.appendReplacement(sb, "dog"); 
foundNum++， 
if(foundNum == 2) { 
break; 


} 


} 
m.appendTail(sb); 
System.out.println(sb.toSstring()); 


在 这 个 例子 中 ， 我 们 将 前 两 个 "cat" 替 换 为 了 "dog"， 其 他 "cat" 不 
变 ， 输 出 为 : 


one dog, two dog, three cat 


StringBuffer 类 型 的 变量 sb 存放 最 终 的 替换 结果 ，Matcher 内 部 除了 
有 一 个 查找 位 置 ， 还 有 一 个 append 位 置 ， 初 始 为 0， 当 找到 一 个 匹配 的 
子 字 符 串 后 ，appendReplacement () 做 了 三 件 事 情 : 


1) 将 append 位 置 到 当前 匹配 之 前 的 子 字 符 串 append 到 sb 中 ， 在 第 
一 次 操作 中 ， 为 "one"， 第 二 次 为 "， two" 各 


2) 将 替换 字符 串 append 到 sb 中 。 

3) 更 新 append 位 置 为 当前 匹配 之 后 的 位 置 。 
appendTail 将 append 位 置 之 后 所 有 的 字符 append 到 sb 中 。 

至 此 ， 正 则 表达 式 相关 的 主要 Java API 就 介绍 完了 。 我 们 讨论 了 


如 何在 Java 中 表示 正则 表达 式 ， 如 何 利用 它 实现 文本 的 切 分 、 验 证 、 
查找 和 符 换 ， 对 于 替换 ， 下 面 我 们 演示 一 个 簿 单 的 模板 引 擎 。 


25.3 ”模板 引擎 


利用 Java API 元 其 站 Matcher 中 的 儿 个 方法 ， 我 们 可 以 实现 一 个 简 
0 
示 ， 比 如 


String template = "Hi {name}, your code is {code}."; 


这 里 ， 模 板 字 符 串 中 有 两 个 变量 :一 个 是 ame， 田 一 个 是 code 。 
变量 的 实际 值 通过 Map 提 供 ， 变 量 名 称 对 应 Map 中 的 键 ， 模 板 引擎 的 
We 
实现 为 


private static Pattern templatePattern = Pattern.compile("™\\{(\\w+)\\}"); 
public static String templateEngine(String template, 
Map<String, Object> params) { 
StringBuffer sb = new StringBuffer(); 
Matcher matcher = templatePattern.matcher(template); 
while(matcher.find()) { 
String key = matcher.group(1); 
Object value = params.get(key); 
matcher.appendReplacement(sb, value != null 
Matcher .quoteReplacement(value.toSstring()) : ""); 


matcher.appendTail( sb); 
return sb.toString(); 


代码 寻找 所 有 的 模板 变量 ， 正 则 表达 式 为 : 


\{(\w+)\} 


{是 元 字符 ， 所 以 要 转 义 。\w+ 表 示 变 量 名 ， 为 便于 引用 ， 加 了 括 
号 ， 可 以 通过 分 组 1 引用 变量 名 。 


使 用 该 模板 引擎 的 示例 代码 为 : 


public static void templateDemo() { 

String template = "Hi {name}, your code is {code}."; 
Map<String, Object> params = new HashMap<String, Object>(); 
params ,put("name"，" 老 马 " ) ， 

params.put("code", 6789); 
System.out.println(templateEngine(template, params)); 


输出 为 : 
Hi 老 马 ，your code is 6789. 


完整 代码 在 github 上 ， 地 址 为 https://github.com/swiftma/program- 
logic ， 位 于 包 shuo.laoma.regex.c89 下 。 下 一 节 ， 我 们 讨论 和 分 析 一 些 
常见 的 正则 表达 式 .。 


25.4 副 术 季 见 表达 陈 

本 节 来 讨论 和 分 析 一 些 常 用 的 正则 表达 式 ， 具 体 包括 : 

-邮编 。 

电话 号 码 ， 包 括 手机 号 码 和 固定 电话 号 码 。 

日 期 和 时 间 。 

:身份 证 号 。 

-ITP 地 址 。 

:URL 。 

Email 地 址 。 

XT 

对 于 同一 个 目的 ， 正 则 表达 式 往往 有 多 种 写法 ， 大 多 没有 唯一 正 
确 的 写法 ， 本 闻 的 写法 主要 是 示例 。 此 外 ， 写 一 个 正则 表达 式 ， 匹 配 
希望 匹配 的 内 容 往往 比较 容易 ， 但 让 它 不 匹配 不 希望 匹配 的 内 容 则 往 
往 比较 困难 ， 也 就 是 说 ， 保 证 精确 性 经 常 是 很 难 的 ， 不 过 ， 很 多 时 
候 ， 也 没有 必要 写 完全 精确 的 表达 式 ， 需 要 写 到 多 精确 与 需要 处 理 的 
文本 和 需求 有 关 。 另 外 ， 正 则 表达 式 难 以 表达 的 ， 可 以 通过 写 程 序 进 
一 步 处 理 。 这 人 么 描述 可 能 比较 抽象 ， 下 面 ， 我 们 会 具体 讨论 分 析 。 
1. 邮 编 

邮编 比较 简单 ， 就 是 6 位 数字 ， 所 以 表达 式 可 以 为 : 


[0-9]{6} 


这 个 表达 式 可 以 用 于 验证 输入 是 否 为 邮编 ， 比 如 : 


public static Pattern ZIP_CODE_PATTERN = Pattern.compile("[0-9]{6}"); 
public static boolean isZipCode(String text) { 

return ZIP_CODE_PATTERN.matcher(text).matches(); 
} 


但 如 采用 于 查找 ， 这 个 表达 式 是 不 够 的 ， 看 个 例子 : 


public static void findzipcode(String text) { 
Matcher matcher = ZIP_CODE_PATTERN .matcher(text ) ， 
while (matcher .find()) { 
System.out,println(matcher ,group() )， 
} 


public static void main(String[] args) 
findzipcode(" 邮 编 100013， 电 话 18612345678" ) ; 
} 


文本 中 只 有 一 个 邮编 ， 但 输出 却 为 : 


100013 
186123 


这 怎么 办 呢 ? 可 以 使 用 环视 边界 匹配 ， 对 于 左边 界 ， 它 前 面 的 字 
能 是 数字 ， 环 视 表 达 式 为 ， 


(?<1[6-9]) 
对 于 右边 界 ， 它 右边 的 字符 不 能 是 数字 ， 环 视 表 达 式 为 : 
(?1[9-9]) 

所 以 ， 完 整 的 表达 式 可 以 为 : 

(?<![0-9])[e-9]{6}(?![0-9]) 


使 用 这 个 表达 式 ， 将 ZIP_ CODE _ PATTERN 改 为 : 


public static Pattern ZIP_CODE_PATTERN = Pattern.compile( 
"(?<!1[9-9])" // 左 边 不 能 有 数字 
十 "[0-9]{6}" 
+ "(?1[0-9] )"); // 右 边 不 能 有 数字 


忠 可 以 输出 期 望 的 结果 了 。 6 位 数 子 就 一 定 古 邮编 吗 ? 答案 当然 羡 
否定 的 ， 所 以 ， 这 个 表达 式 也 不 是 精确 的 ， 如 果 需 要 更 精确 的 验证 ， 
可 以 写 程序 进一步 检查 。 

2. 手 机 号 码 


中 国 的 手机 和 号码 都 是 11 位 数 子 ， 所 以 ， 最 简单 的 表达 式 整 古 : 


[0-9]{11} 


不 过 ， 目 前 手机 号 第 1 位 都 是 1， 第 2 位 取 值 为 9、4、5、7、8 之 
一 ， 所 以 更 精确 的 表达 式 是 : 


1[34578][0-9]{9} 


, 为 方便 表达 手机 号 ， 手 机 号 中 间 经 常 有 连 字 符 ( 即 减 号 -') ， 形 
站: 


186-1234-5678 


为 表达 这 种 可 选 的 连 字 符 ， 表 达 式 可 以 改 为 : 


1[34578][0-9]-?[0-9] {4}-?[0-9] {4} 


在 手机 号 前 面 ， 可 能 还 有 0、+86 或 0086， 和 手机 号 码 之 间 可 能 还 
有 一 个 空格 ， 比 如 : 


©018612345678 
+86 18612345678 
©0086 18612345678 


为 表达 这 种 形式 ， 可 以 在 号 码 前 加 如 下 表达 式 : 


((0|\+86|0086)\s?)? 


和 邮编 类 似 ， 如 果 为 了 抽取 ， 也 要 在 左右 加 环视 边界 匹配 ， 左 右 
不 能 是 数字 。 所 以 ， 完 整 的 表达 式 为 : 


(2?<!1[0-9])((0|\+86|0086)\s?)?1[34578] [0-9]-?[0-9]{4}-?[0-9]{4}(?![0-9]) 


用 Java 表 示 的 代码 为 : 


public static Pattern MOBILE PHONE PATTERN = Pattern.compile( 
Re [9-9] )"” // 左 边 不 能 有 数字 
"((0|\\+86|0086)\\s?)?" // 0 +86 0086 
+ "1[34578] [0- 9]-?[0-9]{4}-?[0-9]{4}" // 186-1234-5678 
"(?31[0-9] )"); // 右 边 不 能 有 数字 


3. 固 定 电话 号 码 


不 考虑 分 机 ， 中 国 的 固定 电话 一 般 由 两 部 分 组 成 : 区 号 和 市 内 号 
区 号 是 3 到 4 位 ， 市 内 号 码 是 7 到 8 位 。 区 号 以 0 开头 ， 表 达 式 可 以 


6[6-9]{2, 3} 
市 内 号 码 表达 式 为 : 
[9-9]{7, 8} 


区 号 可 能 用 括号 包含 ， 区 号 与 市 内 号 码 之 间 可 能 有 连 字 符 ， 如 以 
下 形式 .: 


010-62265678 
(010)62265678 


整个 区 号 是 可 选 的 ， 所 以 整个 表达 式 为 : 


(\(?0[0-9]{2,3}\)?-?)?[0-9]{7,8} 


再 加 上 左右 边界 环视 ， 完 整 的 Java 表 示 为 : 


public static Pattern FIXED_PHONE_PATTERN = Pattern.compilel( 
"(?<1[9-9] )" // 左 边 不 能 有 数字 
+ "(\\(?0[0-9]{2,3}\\)?-?)?" // 区 号 
+ "[0-9] {7,8}"// 市 内 号 码 
+ "(?31[96-9])"); // 右 边 不 能 有 数字 


4. 日 期 
日 期 的 表示 方式 有 很 多 种 ， 我 们 只 看 一 种 ， 形 如 : 


2017-06-21 
2016-11-1 


年 月 日 之 间 用 连 字 符 分 隔 ， 月 和 日 可 能 只 有 一 位 。 最 简单 的 正则 
表达 式 可 以 为 : 


\d{4}-\d{1,2}-\d{1, 2} 


年 一 般 没 有 限制 ， 但 月 只 能 取 值 1 一 12， 日 只 能 取 值 1~31， 怎 么 
表达 这 种 限制 呢 ? 


对 于 月 ， 有 两 种 情况 ，1 月 到 9 月 ， 表 达 式 可 以 为 : 


9?[1-9] 


10 月 到 12 月 ， 表 达 式 可 以 为 : 


1[0-2] 


所 以 ， 月 的 表达 式 为 : 
(9?[1-9]11[60-2]) 

对 于 日 ， 有 三 种 情况 

1 到 9 号 ， 表 达 式 为 : 0? [1-9]。 
10 号 到 29 号 ， 表 达 式 为 : [1-2][0-9] 。 


.30 号 和 31 号 ， 表 达 式 为 : 3[01] 。 
所 以 ， 整 个 表达 式 为 : 


xd{t4}-(0?[1-9]11[0-2])-(0?[1-9]|1[1-2][0-9]13[01] ) 


加 上 左右 边界 环视 ， 完 整 的 Java 表 示 为 : 


public static Pattern DATE_PATTERN = Pattern.compile( 
"(?<![8-9])" // 左 边 不 能 有 数字 


+ "NNd{4}-" // 年 

+ "(9?[1-9]|1[6-2])-" // 月 

+ "(0?[1-9] |[1-2][9- a 1// 
+ "(?1[9-9])")， // 和 右边 不 能 有 数字 


5. 时 间 


考虑 24 小 时 制 ， 只 考虑 小 时 和 分 钟 ， 小 时 和 分 钟 都 用 固定 两 位 表 
示 ， 格 式 如 下 : 


10:57 


基本 表达 式 为 : 


\d{2}:\d{2} 


小 时 取 值 范围 为 0~23， 更 精确 的 表达 式 为 ; 


([9-1]j[9-9]12[9-3]) 


分 钟 取 值 范 围 为 0 一 59， 更 精确 的 表达 式 为 : 


[9-5][9-9] 


所 以 ， 整 个 表达 式 为 : 


([9-1]j[9-9]12[9-3]):[9-5][9-9] 


加 上 左右 边界 环视 ， 完 整 的 Java 表 示 为 : 


public Stalse Pattern TIME_ PATTERN = Pattern.compile( 
(ee 国人 // 左边 不 能 有 数字 
十 "ee 1] [9- 9]12[9- 3]) // 小 时 
十 + "[9-5][9 六 // 分 名 
+ "(21[0- 9])"); 右边 不 能 有 数字 


6. 喘 份 证 号 

号 份 证 有 一 代 和 二 代 之 分 ， 一 代 续 份 证 与 是 15 位 数 宇 ， 二 代 吴 份 
证 号 是 18 位 数字 ， 都 不 能 以 0 开头 。 对 于 二 代 身 份 证 号 ， 最 后 一 位 可 能 
为 x 或 X， 其 他 是 数字 。 一 代 喘 份 证 号 表达 式 可 以 为 : 


[1-9] [0-9] {14} 
二 代号 份 证 号 表达 式 可 以 为 : 
[1-9] [0-9] {16}[0-9xX] 


人 征 相 同 的 ， 二 代 吴 份 证 号 表达 式 多 了 如 
容 : 


[0-9] {2}[0-9xX] 


所 以 ， 它 们 可 以 合并 为 一 个 表达 式 ， 有 即 : 


[1-9] [0-9]{14}([0-9]{2}[0-9xX])? 


加 上 左右 边界 环视 ， 完 整 的 Java 表 示 为 : 


public Statie Pattern ID_CARD_PATTERN = Pattern.compilel( 
no 9] )"”// 左 边 不 能 有 数字 
"[1-9] [0-9]{14}"” // 一 代 身份 证 
"([0-9]{2}[0-9xX] )?"” // 二 代 身 份 证 多 出 的 部 分 
"(?1[0-9])"); // 右 边 不 能 有 数字 


符合 这 个 要 求 的 融 一 定 是 号 份 证 号 吗 ? 当然 不 是 ， 身 份 证 号 还 有 
一 些 更 为 具体 的 要 求 ， 本 书 吏 不 探讨 了 。 


7.IP 地 址 
IP 地 址 示例 如 下 : 


192.168.3.5 


点 号 分 隔 ，4 段 数字 ， 每 个 数字 范围 是 0~255。 最 简单 的 表达 式 
为 : 


(\d{1,3}\.){3}\d{1-3} 


dl 3} 太 简单 ， 没 有 满足 0~255 之 间 的 约束 ， 要 满足 这 个 约 
束 ， 需 要 分 多 种 情况 考虑 。 


值 是 1 位 数 ， 前 面 可 能 有 0~2 个 0， 表 达 式 力 : 


9{t9,2}[9-9] 


值 是 两 位 数 ， 前 面 可 能 有 一 个 0， 表 达 式 为 : 
9?[0-9]{2} 


本 RE 又 要 分 为 多 种 情况 。 以 1 开头 的 ， 后 两 位 没有 限制 ， 


1[0-9]{2} 


以 2 开头 的 ， 如 果 第 二 位 是 0 到 4， 则 第 三 位 没有 限制 ， 表 达 式 为 : 


2[0-4] [60-9] 


如 有 果 第 二 位 是 5， 则 第 三 位 取 值 为 0 到 5， 表 达 式 为 : 
25[0-5] 

所 以 ，\d{1，3} 更 为 精确 的 表示 为 : 
(0{0,2}[0-9]10?[0-9]{2}|1[0-9]{2}|2[0-4][0-9]125[90-5]) 


所 以 ， 加 上 左右 边界 环视 ，IP 地 址 的 完整 Java 表 示 为 : 


public static Pattern IP_PATTERN = Pattern.compile( 
i, [9-9] )"” // 左 边 不 能 有 数字 


+ "((9{9,2}[90-9]19?[0-9]{t2}+11[9-9]{t2}12[90-4][9-9]125[9- 5])N\、\.){3] 
+ "(0{0,2}[0-9]19?[0-9]{2}|1[0-9]{2}12[90-4][0-9]125[0-5])" 
+ "(?1[0-9])"); // 右 边 不 能 有 数字 


8.URL 


URL 的 格式 比较 复杂 ， 其 规范 定义 在 
https:/tools.ietf.org/htmlrfc1738 ， 我 们 只 考虑 HTTP 协 议 ， 其 通用 格式 
日 
A 


http://<host>:<port>/<path>?<searchpart> 


开始 是 http:/， 接 着 是 主机 和 名， 主机 名 之 后 是 可 选 的 端口 ， 再 之 后 


http://www.example.com 
http://www.example.com/ab/c/def .html 
http://www.example.com:8080/ab/c/def?q1=abc&q2=def 


0 
以 旋 : 


[-0-9a-ZA-Z,]+ 


端口 部 分 可 以 写 为 : 
(:\d+)? 


路 径 由 多 个 子路 径 组 成 ， 每 个 于 路 径 以 /开头 ， 后 跟 零 个 或 多 个 
非 /的 字符 ， 简 单 地 说 ， 表 达 式 可 以 为 : 


(A[^/]*)* 


更 精确 地 说 ， 把 所 有 人 允许 的 子 符 列 出 来 ， 表达 式 为 : 


(/[-\w$.+!*'(),%;:@8=]*)* 


对 于 查询 子 符 串 ， 人 简单 地 说 ， 由 非 空 字符 串 组 成 ， 表 达 式 为 : 


\?[NS]* 


更 精确 的 ， 把 所 有 人 允许 的 字符 列 出 来 ， 表 达 式 为 : 


\?[-\w$.+!*'(),%;:Q@8=]* 


路 径 和 查询 字符 串 是 可 选 的 ， 且 查询 字符 串 只 有 在 至 少 存在 一 个 
路 径 的 情况 下 才能 出 现 ， 其 模式 为 : 


(/<sub_path>(/<sub_path>)*(\?<search>)?)? 


所 以 ， 路 径 和 查询 部 分 的 简单 表达 式 为 : 


(ZL^/A]* (CAL )* (ON?LNS]*)?)? 


(/[-\w$.+!1™'(),%;:@8=]*(/[-\w$.+!™ (),%;:@8=]*)*(\?[-\w$.+!*"(),%;:@8=]*)?)? 


HTTP 的 完整 Java 表 达 式 为 : 


public static Pattern HTTP_PATTERN = Pattern.compile( 
"http://" + "[-0-9a-zA-Z.]+" // 主 机 名 
+ "(:\\d+)?" // 端 
+ "(" // 可 选 的 路 径 和 查询 - 开始 
+ "/[-\\w$.+!1*'(),%;:@&=]*" // 第 一 层 路 径 
+ "(A/[-\\w$.+!1*'(),%;:@&=]*)*" // 可 选 的 其 他 层 路 径 
+ "(NN\?[-\\w$.+1*'(),%;:@&=]*)?"” // 可 选 的 查询 字符 串 
+ ")?"); // 可 选 的 路 径 和 查询 - 结束 


9.Email 地 址 


完整 的 Email 规范 比较 复杂 ， 和 定义 在 https:/Wtools.ietf.org/html/rfc822 
， 我 们 先 看 一 些 实际 中 常用 的 。 比 如 新 浪 邮 箱 : 


abc@sina.com 


对 于 用 户 名 部 分 ， 它 的 要 求 是 : 4~16 个 字符 ， 可 使 用 英文 小 写 、 
数字 、 下 画 线 ， 但 下 画 线 不 能 在 首尾 。 怎 么 验证 用 户 名 呢 ? 可 以 为 : 


[a-z0-9] [a-z0-9_]1{2,14}[a-z0-9] 


新 浪 邮 箱 的 完整 Java 表 达 式 为 : 


public static Pattern SINA EMAIL_PATTERN = Pattern.compilel( 
mh Ll 
[a-z0-9] 
+ "[a-z0-9_]{2,14}" 
+ "[a-z0-9]@sina\\.com"); 


我 们 再 来 看 QQ 邮箱 ， 它 对 于 用 户 名 的 要 求 为 : 

1) 3 一 18 个 字符 ， 可 使 用 英文 、 数 字 、 减 号 、 点 或 下 画 线 ; 
2) 必须 以 英文 字母 开头 ， 必 须 以 英文 字母 或 数字 结尾 ; 
3) 点 、 减 号 、 下 夯 线 不 能 连续 出 现 两 次 或 两 次 以 上 。 

如 果 只 有 第 1 条 ， 可 以 为 : 


[-0-9a-zA-Z._]{3,18} 


为 满足 第 2 条 ， 可 以 改 为 : 


[a-zA-Z][-0-9a-zA-Z._]{1,16}[a-zA-Z0-9] 


怎么 满足 第 3 条 呢 ? 可 以 使 用 边界 环视 ,左边 加 如 下 表达 式 : 
(21[-0-9a-zA-Z._]*(--I\.\.|  )) 

完整 表达 式 可 以 为: 
(21[-0-9a-zA-Z._]*(--I\.\.| ))[a-zA-Z][-0-9a-zA-Z._]{1,16}[a-zA-Z0-9] 


QQ 邮箱 的 完整 Java 表 达 式 为 : 


public static Pattern QQ_EMAIL_PATTERN = Pattern,.compIle( 
// 点 、 减 号 、 下 画 线 不 能 连续 出 现 两 次 或 两 次 以 上 
"(?31[-0-9a-ZA-Z._ ]*(--|NNANNA | ))” 
+ "[a-zA-Z]" // 必 须 以 英文 字母 开头 
+ "[-0-9a-zA-Z._]{1,16}"” //3~18 位 英文 、 数 字 、 减 号 、 点 、 下 画 线 组 成 
+ "[a-zA-Z0-9]@qq\\.com"); // 由 英文 字母 、 数 字 结 尾 


以 上 都 是 特定 邮箱 服务 商 的 要 求 ， 一 般 的 邮箱 是 什么 规则 呢 ? 一 
人 
疫 规则 是 : 


-由 英文 字母 、 数 字 、 下 画 线 、 减 号 、 点 号 组 成 ; 


.至 少 1 位 ， 不 超过 64 位 ; 
:开头 不 能 是 减 号 、 点 号 和 下 男 线 。 
比如 : 


h_llo-abc.good@example.com 
这 个 表达 式 可 以 为 : 
[90-9a-zA-Z][-._0-9a-zA-Z]{0,63} 


域名 部 分 以 扩 号 分 隔 为 多 个 部 分 ， 至 少 有 两 个 部 分 。 最 后 一 部 分 
是 顶级 域名 ， 由 2 一 3 个 英文 字 母 组 成 ， 表 达 式 可 以 为 : 


[a-zA-Z]{2,3} 


分 隔 的 部 分 ， 每 个 部 分 一 般 由 字母 、 数 字 、 


对 于 域名 的 其 他 后 
开头 ， 长 度 不 能 超过 63 个 字符 ， 表 达 式 可 以 


ee 
减 号 组 成 ， 但 减 号 不 能 在 
为 : 


[0-9a-zA-Z][-0-9a-zA-Z]{0,62} 


所 以 ， 域 名 部 分 的 表达 式 为 ; 


([0-9a-zA-Z][-0-9a-zA-Z]{0,62}\.)+[a-zA-Z]{2,3} 


完整 的 Java 表 示 为 : 


public static Pattern GENERAL_EMAIL PATTERN = Pattern.compilel( 
"[0-9a-zA-Z][-._0-9a-zA-Z]{9,63}" // 用 户 名 
这 "@" 
+ "([0-9a-zA-Z][-0-9a-zA-Z]{9,62}\\.)+" // 域 名 部 分 
+ "[a-zA-Z]{2,3}"); // 顶 级 域名 


10. 中 文字 符 
中 文字 符 的 Unicode 编 号 一 般 位 于 \u4e00~Au9fff 之 间 ， 所 以 匹配 任 
意 一 个 中 文字 符 的 表达 式 可 以 为 : 


[\u4e00-\u9fff] 


Java 表 达 式 为 : 


public static Pattern CHINESE_ PATTERN = Pattern.compile( 
"[\\u4e00-\\u9fff]"); 


LZ 


本 厄 详 细 讨 论 和 分 析 了 一 些 常见 的 正则 表达 式 。 在 实际 开发 中 ， 
有 些 可 以 直接 使 用 ， 有 些 需要 根据 具 体 文本 和 需求 进行 调整 。 完 整 的 
代码 在 Github 上 ， 地 址 为 https://github.com/swiftma/program-logic ， 位 
于 包 shuo.laoma.regex.c90 下 。 


至 此 ， 关 于 正则 表达 式 束 介绍 完了 。 下 一 章 ， 我 们 探讨 Java 8 中 的 


第 26 章 ”函数 式 编程 


Java 8 引入 了 一 个 重要 新 语法 Lambda 表 达 式 ， 它 是 一 种 紧凑 
的 传递 代码 的 方式 ， 利 用 它 ， 可 以 实现 简洁 灵活 的 函数 式 编 程 。 


基于 Lambda 表 达 式 ， 针 对 第 见 的 集合 数据 处 理 ，Java 8 引入 了 一 
套 新 的 类 库 ， 位 于 包 java.util.stream 下 ， 称 为 Stream API。 这 套 API 操 作 
数据 的 思路 不 同 于 我 们 之 前 介绍 的 容 旭 类 API， 它 们 是 范 数 式 的 ， 非 
常人 简洁、 灵活 、 易 读 。 


Stream API 是 对 容器 类 的 增强 ， 它 可 以 将 对 集合 数据 的 多 个 操作 
以 流水 线 的 方式 组 合 在 一 起 。Java 8 还 增加 了 一 个 新 的 类 
CompletableFuture， 它 是 对 并 发 编程 的 增强 ， 可 以 方便 地 将 多 个 有 一 
0 大 大 简化 多 异步 
务 藤 o 


利用 Lambda 表 达 式 ，Java 8 还 增强 了 日 期 和 时 间 API。 


本 章 束 来 介绍 这 些 Java 8 引入 的 函数 式 编 程 特性 和 API， 上 有 具体 分 为 
5 节 : 26.1 节 介绍 Lambda 表 达 式 ; 26.2 节 介绍 函数 式 数 据 处 理 的 基本 用 
法 ; 26.3 太 重点 讨论 函数 式 数 据 处 理 中 的 收集 器 ;，26.4 节 介绍 组 合式 异 
步 编 程 CompletableFuture; 26.5 广 介绍 Java 8 的 日 期 和 时 间 API。 


26.1 Lambda 表达 式 


Lambda 表 达 式 到 底下 什么 ?” 有 什么 用 ? 本 市 进行 评 细 探讨 。 
Lambda 这 个 名 字 来 源 于 学 术 界 的 种 算 ， 具 体 我 们 束 不 探讨 了 。 理解 
Lambda 表 达 式 ， 我 们 需要 驳回 顾 一 下 接口 、 匿 名 内 部 类 和 代码 传递 。 


26.1.1 通过 接口 传递 代码 


我 们 之 前 介绍 过 接口 以 及 面向 接口 的 编程 ， 针 对 接口 而 非 具体 类 
型 进行 编程 ， 可 以 降低 程序 的 硝 合 性 ， 提 高 灵活 性 ， 提 高 复 用 性 。 接 
口 第 被 用 于 传递 代码 ， 比如 ， 我 们 知道 File 有 如 下 方法 : 


public File[] listFiles(FilenameFilter filter) 


listFiles 需 要 的 其 实 不 是 FilenameFilter 对 象 ， 而 是 它 包 含 的 如 下 方 
法 : 


boolean accept(File dir, String name); 


或 者 说 ，listFiles 布 望 接 受 一 段 方 法 代码 作为 参数 ， 但 没有 办 法 直 
接 传 递 这 个 方法 代码 本 身 ， 只 能 传递 一 个 接口 。 


再 如 ， 类 Collections 中 的 很 多 方法 都 接受 一 个 参数 Comparator， 比 
如 : 


public static <T> void sort(List<T> list, Comparator<? super T> c) 


它们 需要 的 也 不 是 Comparator 对 象 ， 而 是 它 包 含 的 如 下 方法 : 


int compare(T 01，T 02); 


但 是 ， 没 有 办 法 直接 传递 方法 ， 只 能 传递 一 个 接口 。 


又 如 ， 异 步 任务 执行 服务 ExecutorService， 提 交 任 务 的 方法 有 : 


<T> Future<T> submit(Callable<T> task); 
Future<?> submit(Runnable task); 


Callable 和 Runnable 接 口 也 用 于 传递 任务 代码 。 


通过 接口 传递 行为 代码 ， 束 要 传递 一 个 实现 了 该 接口 的 实例 对 
象 ， 在 之 前 的 章节 中 ， 最 简洁 的 方式 是 使 用 匿名 内 部 类 ， 比 如 : 


// 列 出 当前 目录 下 的 所 有 扩展 名 为 .txt 的 文件 
File f = new File("."); 
File[] files = f.]listFiles(new FilenameFilter(){ 
Q@Override 
public boolean accept(File dir, String name) { 
if(name.endswith(".txt"))t{ 
return true; 


return false,; 
} 
}); 


将 files 按 照 文件 名 排序 ， 代 码 为 : 


Arrays.sort(files, new Comparator<File>() { 
@Override 
public int compare(File f1, File f2) { 
return fi.getName().compareTo(f2.getName( )); 


}); 
提交 一 个 最 简单 的 任务 ， 代 码 为 : 


ExecutorService executor = Executors.newFixedThreadPool(100); 
executor ,Submit(new Runnable() { 
@Override 
public void run() { 
System.out.printin("hello world"); 


}); 


26.1.2 ” Lambda 语法 


Java 8 提供 了 一 种 新 的 紧 趴 的 传递 代码 的 语法 : Lambda 表 达 式 。 对 
于 前 面 列 出 文件 的 例子 ， 代 码 可 以 改 为 : 


File f = new File("."); 
File[] files = f.1listFiles((File dir, String name) -> { 
if(name.endswWith(".txt")) { 
return true; 


return false,; 


}); 


可 以 看 出 ， 相 比 匿名 内 部 类 ， 传 递 代 码 变 得 更 为 直观 ， 不 再 有 实 
现 接口 的 模板 代码 ， 不 再 声明 方法 ， 也 没有 名 字 ， 而 征 直 接 给 出 了 方 
法 的 实现 代码 。Lambda 表 达 式 由 -> 分 隅 为 两 部 分 ， 前 面 是 方法 的 参 
数 ， 后 面 人 } 内 古方 法 的 代码 。 上 面 的 代码 可 以 人 简化 为 : 


File[] files = f.,]listFiles((File dir, String name) -> { 
return name.endswith(".txt"); 
}); 


当主 体 代 码 只 有 一 条 语句 的 时 候 ， 括 号 和 return 语 句 也 可 以 省 略 ， 
上 面 的 代码 可 以 变 为 : 


File[] files = f.1listFiles((File dir, String name) -> name.endswith(".txt")); 


注意 : 没有 括号 的 时 候 ， 主 体 代 码 是 一 个 表达 式 ， 这 个 表达 式 的 
值 就 是 函数 的 返回 值 ， 结 尾 不 能 加 分 号 ， 也 不 能 加 returm 语 句 。 


方法 的 参数 类 型 声明 也 可 以 省 略 ， 上 面 的 代码 还 可 以 继续 简化 


File[] files = f,1ListFiles((dir，name) -> name.endswith(".txt")); 


之 所 以 可 以 省 略 方法 的 参数 类 型 ， 是 因为 Java 可 以 目 动 推断 出 来 ， 
它 知道 listFiles 接 受 的 参数 类 型 是 FilenameFilter， 这 个 接口 只 有 一 个 方 
法 accept， 这 个 方法 的 两 个 参数 类 型 分 别 是 File 和 String。 这 样 测 化 下 
来 ， 代 码 是 不 是 人 简洁 多 了 ? 


排序 的 代码 用 Lambda 表 达 式 可 以 写 为 : 


Arrays.sort(files, (f1, f2) -> fi.getName().compareTo(f2.getName())); 


提交 任务 的 代码 用 Lambda 表 达 式 可 以 写 为 : 


executor.submit(()->System.out.printin("hello")); 


参数 部 分 为 空 ， 写 为 () 。 
当 参 数 只 有 一 个 的 时 候 ， 参 数 部 分 的 括号 可 以 省 略 。 比 如 ，FEile 还 


public File[] listFiles(FileFilter filter) 


FileFilter 的 定义 为 : 


public interface FileFilter { 
boolean accept(File pathname ) ， 
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使 用 FileFilter 重 写 上 面 的 列举 文件 的 例子 ， 代 码 可 以 为 : 


File[] files = f.1istFiles(path -> path.getName().endswith(".txt")); 


与 匿名 内 部 类 类 似 ，Lambda 表 达 式 也 可 以 访问 定义 在 主体 代码 外 
部 的 变量 ， 但 对 于 局 部 变量 ， 它 也 只 能 访问 final 类 型 的 变量 ， 与 匿名 内 
ee 能 被 重新 赋 

oO 0: 


String msg = "hello world"; 
executor,.submit(()->System.out.printin(msg)); 


可 以 访问 局 部 变量 msg， 但 msg 不 能 被 重新 赋值 ， 如 果 这 样 写 


String msg = "hello world"; 
msg = "good morning"; 
executor ,Submit(()->System,out,.println(msg) )， 


Java 编 译 紫 会 提示 错误 。 


这 个 原因 与 匿名 内 部 类 是 一 样 的 ，Java 会 将 msg 的 值 作为 参数 传递 
给 Lambda 表 达 式 ， 为 Lambda 表 达 式 建立 一 个 副本 ， 它 的 代码 访问 的 是 
这 个 副本 ， 而 不 是 外 部 声明 的 msg 变 量 。 如 果 人 允许 msg 被 修改 ， 则 程序 
员 可 能 会 误 以 为 Lambda 表 达 式 读 到 修改 后 的 值 ， 引 起 更 多 的 混淆 。 


为 什么 非 要 建立 副本 ， 直 接 访 问 外 部 的 msg 变 量 不 行 吗 ? 不 行 ， 因 
为 msg 定 义 在 栈 中 ， 当 Lambda 表 达 式 被 执行 的 时 候 ，msg 可 能 早已 被 释 
放 了 。 如 果 硕 望 能 够 修改 值 ， 可 以 将 变量 定义 为 实例 变量 ， 或 者 将 变 
量 定义 为 数组 ， 比 如 ; 


String[] msg = new String[]{"hello world"}; 
msg[9] = "good morning"; 
executor,.submit(()->System.out.printin(msg[0])); 


从 以 上 内 容 可 以 看 出 ，Lambda 表 达 式 与 匿名 内 部 类 很 像 ， 主 要 就 
是 简化 了 语法 ， 那 它 是 不 是 语法 糖 ， 内 部 实现 其 实 就 是 内 部 类 呢 ? 答 
案 是 否定 的 ，Java 会 为 每 个 匿名 内 部 类 生成 一 个 类 ， 但 Lambda 表 达 式 
不 会 。Lambda 表 达 式 通常 比较 短 ， 为 每 个 表达 式 生成 一 个 类 会 生成 大 


量 的 类 ， 人 性 能 会 受到 影响 。 


内 部 实现 上 ，Java 利 用 了 Java 7 引入 的 为 文 持 动态 类 型 语言 引入 的 
invokedynamic 指 令 、 方 法 句柄 (method handle) 等 ， 有 具体 实现 比较 复 
杂 ， 我 们 就 不 探讨 了 ， 感 兴趣 的 读者 可 以 参看 
http://cr.openjdk.java.net/~briangoetz/lambda/lambda-translation.html ， 我 
们 需要 知道 的 是 ，Java 的 实现 是 非常 高 效 的 ， 不 用 担心 生成 太 多 类 的 问 


题 。 


Lambda 表 达 式 不 是 匿名 内 部 类 ， 那 它 的 类 型 到 底 是 什么 呢 ? 是 函 
数 式 接口 。 


26.1.3 ”函数 式 接 口 


Java 8 引入 了 画 数 式 接 口 的 概念 ， 函 数 式 接口 也 古 接 口 ， 但 只 能 
一 个 抽象 方法 ， 前 面 提 及 的 接口 都 只 有 一 个 抽象 方法 ， 都 是 函数 式 接 
口 。 之 所 以 强调 是 “抽象 "方法 ， 是 因为 Java 8 中 还 允许 定义 静态 方法 和 
默认 方法 。Lambda 表 达 式 可 以 赋值 给 函数 式 接口 ， 比 如 : 


FileFilter filter = path -> path.getName().endswith(".txt"); 

FilenameFilter fileNameFilter = (dir, name) -> name.endswith(".txt"); 

Comparator<File> comparator = (f1i, f2) -> 
f1i.getName().compareTo(f2.getName()); 

Runnable task = () -> System.out.println("hello world"); 


如 果 看 这 些 接口 的 定义 ， 会 发 现 它 们 都 有 一 个 注解 
@FunctionalInterface， 比 如 : 


@FunctionalInterface 

public interface Runnable { 
public abstract void run(); 

} 


@FunctionalInterface 用 于 清晰 地 告知 使 用 者 这 是 一 个 函数 式 接口 ， 
不 过 ， 这 个 注解 不 是 必需 的 ， 不 加 ， 只 要 只 有 一 个 抽象 方法 ， 也 是 函 
数 式 接口 。 但 如 果 加 了 ， 而 又 定义 了 超过 一 个 抽象 方法 ，Java 编 译 圳 会 
报错 ， 这 类 似 于 我 们 之 前 介绍 的 Override 注 解 。 


26.1.4 ”预定 义 的 函数 式 接 口 


Java 8 定义 了 大 量 的 预定 义 函 数 式 接口 ， 用 于 常见 类 型 的 代码 传 
递 ， 这 些 函 数 定义 在 包 java.utilfunction 下 ， 主 要 接口 如 表 26-1 所 示 。 


表 26-1 主要 的 预定 义 函 数 式 接口 


predibaleaiis 谓词 ， 测 试 输入 是 否 满足 条 件 
incline RS 函数 转换 ， 输 入 类 型 T， 输 出 类 型 R 
Consumer<T> 消费 者 ， 输 入 类 型 

Supplier<T> LU 方 突 

iy OVO 函数 转换 的 特例 ， 输 入 和 输出 类 型 一 梯 


BiFunction<T, U, R> 函数 转换 ， 接 受 两 个 参数 ， 输 出 及 
BinaryOperator<T> BiFunction 的 特例 ， 输 入 和 输出 类 型 一 样 
BiConsumer<T. U> 消费 者 ， 接 受 两 个 参数 

Biprellioate<T. U> 谓词 ， 接 受 两 个 参数 


对 于 基本 类 型 boolean、int、long 和 double， 为 避免 装 箱 / 拆 箱 ，Java 
8 提供 了 一 些 专门 的 函数 ， 比 如 ，int 相 关 的 部 分 函数 如 表 26-2 所 示 。 


表 26-2 int 类 型 的 函数 式 接 口 


IntPredicate 谓词 ， 测 试 输入 是 否 满足 条 件 
IntFunction<R> 函数 转换 ， 输 入 类 型 int， 输 出 类 型 R 
IntConsumer 消费 者 ， 输 入 类 型 int 

ee A 


这 些 画 数 有 什么 用 呢 ? 它 们 被 大 量 用 于 Java 8 的 函数 式 数 据 处 理 
Stream 相 关 的 类 中 ， 即 使 不 使 用 Stream， 也 可 以 在 自己 的 代码 中 直接 使 
用 这 些 预 定义 的 函数 。 我 们 看 一 些 位 单 的 示例 ， 包 括 Predicate 、 


Function 和 Consumer。 
1.Predicate 示 例 


为 便于 举例 ， 我 们 先 定 义 一 个 简单 的 学 生 类 Student， 它 有 name 和 
score 两 个 属性 ， 如 下 所 示 。 


static class Student { 
String name; 
double score,; 


} 


我 们 省 略 了 构造 方法 和 gettersetter 方 法 。 
有 一 个 学 生 列 表 : 


List<Student> Students = Arrays.asList(new Student[] { 
new Student("zhangsan", 89d), new Student("lisi", 89d), 
new Student("wangwu", 98d) }); 


在 日 党 开发 中 ， 列表 处 理 的 一 个 常见 需 求 是 过 滤 ， 列 表 的 类 型 经 
常 不 一 样 ， 过 小 的 条 件 也 经 常 变化 ， 但 主体 逻辑 都 是 类 似 的 ， 可 以 借 
助 Predicate 写 一 个 通用 的 二 上 如 下 所 示 : 


public static <E> List<E> filter(List<E> list, Predicate<E> pred) { 
List<E> retList = new ArrayList<>(); 
for(E e : list) { 
if(pred.test(e)) { 
(e) 


retList.add(e); 


} 
return retList,; 
} 
这 个 方法 可 以 这 么 用 : 
// 过 滤 90 分 以 上 的 


students = filter(students, t -> t.getScore() > 90); 


2.Function 示 例 


列表 处 理 的 男 一 个 常见 需求 是 转换 。 比 如 ， 给 定 一 个 学 生 列表 ， 
需要 返回 名 称 列表 ， 或 者 将 名 称 转换 为 大 写 返回 ， 可 以 借助 Fanction 写 
一 个 通用 的 方法 ， 如 下 所 示 : 


public static <T, R> List<R> map(List<T> list, Function<T, R> mapper) { 
List<R> retList = new ArrayList<>(1ist.size()); 
for(Te : list) { 
retList.add(mapper .apply(e)); 


return retList,; 


根据 学 生 列表 返回 名 称 列表 的 代码 为 : 


List<String> names = map(students, t -> t.getName()); 


将 学 生 名 称 转换 为 大 写 的 代码 为 : 


students = map(students, t -> new Student( 
t.getName().toUpperCase(), t.getSscore())); 


3.Consumer 示 例 


在 上 面 转换 学 生 名 称 为 大 写 的 例子 中 ， 我 们 为 每 个 学 生 创建 了 一 
个 新 的 对 象 ， 男 一 种 常见 的 情况 是 直接 修改 原 对 象 ， 通 过 代码 传递 ， 
这 时 ， 可 以 用 Consumer 写 一 个 通用 的 方法 ， 比 如 : 


public static <E> void foreach(List<E> list, Consumer<E> consumer) { 
for(E e : list) { 
consumer .accept(e); 
} 
} 


上 面 转换 为 大 写 的 例子 可 以 改 为 : 


foreach(students, t -> t.setName(t.getName().toUpperCase())); 


以 上 这 些 示例 主要 用 于 演示 函数 式 接口 的 基本 概念 ， 实 际 中 可 以 
直接 使 用 流 API 。 


26.1.5 方 佑 引用 
Lambda 表 达 式 经 常用 于 调用 对 象 的 某 个 方法 ， 比 如 : 
Ce 
这 时 ， 它 可 以 进一步 简化 ， 如 下 所 示 : 


List<String> names = map(students, Student::getName); 


Student: : getName 这 种 写法 是 Java 8 引入 的 一 种 狐 语 法 ， 称 为 方 
法 引用 。 它 是 Lambda 表 达 式 的 一 种 简写 方法 ， 由 : : 分 隔 为 两 部 分 ， 
前 面 是 类 名 或 变量 名 ， 后 面 是 方法 名 。 方 法 可 以 是 实例 方法 ， 也 可 以 
是 静态 方法 ， 但 含义 不 同 。 


我 们 看 一 些 例子 ， 还 是 以 Student 为 例 ， 先 增加 一 个 静态 方法 : 


public static String getCollegeName(){ 
return "Laoma School",; 


对 于 静态 方法 ， 如 下 两 条 语句 是 等 价 的 : 


1. Supplier<String> s 
2. Supplier<String> s 


Student: :getcollegeName; 
() -> Student.getCollegeName(); 


它们 的 参数 都 是 空 ， 返 回 类 型 为 String 。 


a 它 的 第 一 个 参数 驶 是 该 类 型 的 实例 ， 比 如 ， 如 
下 两 条 语句 是 等 价 的 : 


1. Function<Student, String> f = Student::getName; 
2, Function<Student, String> f = (Student t) -> t.getName(); 


对 于 Student: : setName， 它 是 一 个 BiConsumer， 即 如 下 两 条 语句 
是 等 价 的 : 


1. BiConsumer<Student, String> c 
2, BiConsumer<Student, String> c 


Student: :setName; 
(t, name) -> t.setName(name); 


如 有 果 方 法 引用 的 第 一 部 分 是 变量 名 ， 则 相当 于 调用 那个 对 象 的 方 
法 。 比 如 ， 假 定 十 一 个 Student 类 型 的 变量 ， 则 如 下 两 条 语句 是 等 价 


的 : 


1. Supplier<String> s 
2. Supplier<String> s 


t::getName; 
() -> t.getName(); 


下 面 两 条 语句 也 是 等 价 的 : 


1., Consumer<String> consumer 
2, Consumer<String> consumer 


t::setName; 
(name) -> t.setName(name); 


对 于 构造 方法 ， 方 法 引用 的 语法 是 < 类 名 >: : new， 如 Student: 
new， 即 下 面 两 条 语句 等 价 : 


1. BiFunction<String, Double, Student> s = (name, score) 
-> new Student(name, score); 
2, BiFunction<String, Double, Student> s = Student::new; 


26.1.6 ”函数 的 复合 


在 前 面 的 例 于 中 ， 画 数 式 接口 都 用 作 方 法 的 参数 ， 其 他 部 分 通过 
Lambda 表 达 式 传递 具体 代码 给 它 。 函 数 式 接口 和 Lambda 表 达 式 还 可 用 
作 方 法 的 返回 值 ， 传 递 代 码 回调 用 者 ， 将 这 两 种 用 法 结合 起 来 ， 可 以 
构造 复合 的 男 数 ， 使 程序 简洁 易 读 。 


下 面 我 们 看 一 些 例子 ， 这 些 例子 利用 了 Java 8 对 接口 的 增强 ， 即 静 
态 方 法 和 默认 方法 ， 并 利用 它们 实现 复合 函数 ， 包 括 Comparator 接 口 和 


function 包 。 


1.Comparator 中 的 复合 方法 


Comparator 接 口 定 义 了 如 下 静态 方法 : 


public static <T, U extends Comparable<? super U>> Comparator<T> comparing( 
Function<? super T, ? extends U> keyExtractor) { 
Objects.requireNonNull(keyExtractor); 
return (Comparator<T> & Serializable) 
(c1, c2) -> keyExtractor.apply(c1).compareTo(keyExtractor.apply(c2)); 


这 个 方法 是 什么 意思 呢 ? 它 用 于 构建 一 个 Comparator， 比 如 ， 在 前 
面 的 例子 中 ， 对 文件 按照 文件 名 排序 的 代码 为 : 


Arrays.sort(files, (f1, f2) -> fi.getName().compareTo(f2.getName())); 


使 用 comparing 方 法 ， 代 码 可 以 简化 为 : 


Arrays.sort(files, Comparator.comparing(File::getNanme)); 


这 样 ， 代 码 的 可 读 性 是 不 是 大 大 增强 了 ? comparing 方 法 为 什么 能 
达到 这 个 效果 呢 ? 它 构 建 并 返回 了 一 个 符合 Comparator 接 口 的 Lambda 
表达 式 ， 这 个 Comparator 搂 受 的 参数 类 型 是 File， 它 使 用 了 传递 过 来 的 
函数 代码 keyExtractor 尾 File 转 换 为 String 进 行 比较 。 像 comparing 这 样 使 
0 但 调用 者 很 方便 ， 也 很 容 

理解 。 


Comparator 不 有 很 多 默认 方法 ， 我 们 看 两 个 : 


default Comparator<T> reversed() { 
return Collections.reverseOrder(this); 


default Comparator<T> thenComparing(Comparator<? super T> other) { 
Objects.requireNonNull(other); 
return (Comparator<T> & Serializable) (ci1, c2) -> { 
int res = compare(c1, c2); 
return (res != 0) ? res : other.compare(ci, c2); 


reversed 返 回 一 个 新 的 Comparator， 按 原 排序 逆序 排 。 
thenComparing 也 返回 一 个 新 的 Comparator， 在 原 排序 认为 两 个 元 素 排 
序 相 同 的 时 候 ， 使 用 传递 的 Comparator other 进行 比较 。 


看 一 个 使 用 的 例子 ， 将 学 生 列 表 按 照 分 数 倒序 排 (高 分 在 前 )， 
分 数 一 样 的 按照 名 字 进 行 排序 : 


= 


students,.sort(Comparator.comparing(Student: :getScore) 
.reversed() 
,thenComparing(Student : :getName ) ) ， 


这 样 ， 代 码 是 不 是 很 容易 读 ? 
2.function 包 中 的 复合 方法 


在 java.util.function 包 的 很 多 函数 式 接 口 里 ， 都 定义 了 一 些 复 合 方 
法 ， 我 们 看 一 些 例 子 。 


Function 接 口 有 如 下 定义 : 


default <V> Function<T, V> andThen(Function<? Super R, ? extends V> after) { 
Objects.requireNonNull(after); 


return (Tt) -> after.apply(apply(t)); 
} 


先 将 T 类 型 的 参数 转化 为 类 型 R， 再 调用 after 将 R 转 换 为 Vv， 最 后 返 
回 类 型 V。 
还 有 如 下 定义 : 


default <V> Function<V, R> compose( 
Function<? super V, ? extends T> before) { 
Objects.requireNonNull(before); 
return (V v) -> apply(before.apply(v)); 
和 


对 V 类 型 的 参数 ， 先 调用 before 将 V 转 换 为 T 类 型 ， 再 调用 当前 的 
apply 方 法 转换 为 R 类 型 返回 。 


Consumer、Predicate 等 都 有 一 些 复 合 方法 


合 方法， 它们 大 量 用 于 画 数 式 数 
据 处 理 API 中 ， 具 体 我 们 就 不 探讨 了 。 
26.1.7 ”小结 


本 市 介绍 了 Java 8 中 的 一 些 新 概念 ， 包 括 Lambda 表 达 式 、 函 数 式 接 
口 和 方法 引用 等 。 


最 重要 的 变化 是 ， 传 递 代码 变 得 简单 了 ， 函 数 变 为 了 代码 世界 

的 “一 等 公民 ”， 可 以 方便 地 个 作 为 参数 传递 ， 被 作为 返回 值 ， 被 复合 
利用 以 构建 新 的 函数 ， 看 上 去 ， 这 些 只 是 语法 上 的 一 些小 变化 ， 但 利 
用 这 些小 变化 ， 却 能 使 得 代码 更 为 通用 、 更 为 灵活 、 更 为 简洁 易 读 ， 

这 大 概 殉 是 函数 式 编 程 的 奇妙 之 处 。 


26.2 ” 琴 数 式 数 据 处 理 ， 基 本 用 法 


上 上 一世 介 绍 了 Lambda 表 达 式 和 函数 式 接口 ， 本 万 探讨 它们 的 应 
用 : 函数 式 数 据 处 理 ， 针 对 第 见 的 集合 数据 处 理 ，Java 8 引入 了 一 套 新 
的 类 库 ， 位 于 包 java.util.stream 下 ， 称 为 Stream API。 这 套 API 操 作 数 
据 的 思路 不 同 于 我 们 之 前 介绍 的 容 髓 类 API， 它 们 是 函数 式 的 ， 非 常 
答 洛 、 有 灵活 、 易 读 。 有 具体 有 什么 不 同 呢 ? 本 和 先 介 绍 一 些 基本 的 
API， 下 节 讨 论 一 些 高 级 功能 。 


接口 Stream 类 似 于 一 个 迭代 絮 ， 但 提供 了 更 为 丰富 的 操作 ， 
Stream API 的 主要 操作 了 就 定义 在 该 接口 中 。Java 8 给 Collection 接 口 增加 
了 两 个 默认 方法 ， 它 们 可 以 返回 一 个 Stream， 如 下 所 示 : 


default Stream<E> stream() { 
return StreamSupport.stream(spliterator(), false); 


default Stream<E> parallelsStream() { 
return StreamSupport.stream(spliterator(), true); 


} 


stream () 返回 的 是 一 个 顺序 流 ，parallelStream () 返回 的 是 一 
个 并 行 流 。 顺 序 流 束 是 由 一 个 线程 执行 操作 。 而 并 行 流 背 后 可 能 有 多 
个 线程 并 行 执行 ， 与 之 前 介绍 的 并 发 技术 不 同 ， 使 用 并 行 流 不 需要 显 
式 管 理 线程 ， 使 用 方法 与 顺序 流 是 一 样 的 。 


下 面 我 们 主要 针对 顺序 流 学 习 Stream 接 口 ， 包 括 其 用 法 和 基本 原 
理 ， 随 后 我 们 再 介绍 并 行 流 ， 先 来 看 一 些 人 简单 的 示例 。 


26.2.1 基本 示例 


上 一 节 演 示 时 使 用 了 学 生 类 Student 和 学 生 列 表 List<Student>lists， 
0 它们 ， 看 一 些 基本 的 过 小 、 转 换 以 及 过 滤 和 转换 组 合 的 
列子 。 


1. 基 本 过 滤 


返回 学 生 列表 中 90 分 以 上 的 ， 传 统 上 的 代码 一 般 是 这 样 : 


List<Student> above90List = new ArrayList<>(); 
for(Student t : students) { 
if(t.getSscore() > 90) { 
above90List .add(t); 
} 
} 


使 用 Stream API， 代 码 可 以 这 样 : 


List<Student> above90List = students.stream() 
filter(t->t.getSscore()>90).collect(Collectors.toList()); 


先 通 过 stream () 得 到 一 个 Stream 对 象 ， 然 后 调用 Stream 上 的 方 
法 ，filter () 过 滤 得 到 90 分 以 上 的 ， 它 的 返回 值 依然 是 一 个 Stream ， 
为 了 转换 为 List， 调 用 了 collect 方 法 并 传递 了 一 个 Collectors.toList 
() ， 表 示 将 结果 收集 到 一 个 List 中 。 


代码 更 为 简 少 易 读 了 ， 这 种 数据 处 理 方 式 称 为 函数 式 数据 处 理 。 
与 传统 代码 相 比 ， 其 特点 是 : 


1) 没有 显 式 的 循环 沈 代 ， 循 环 过 程 被 Stream 的 方法 隐藏 了 。 


2) 提供 了 声明 式 的 处 理 函 数 ， 比 如 filter， 它 封装 了 数据 过 滤 的 功 
， 而 传统 代码 是 命令 式 的 ， 需 要 一 步 步 的 操作 指令 。 


3) 流畅 式 接 口 ， 方 法 调用 链接 在 一 起 ， 清 晰 易 读 。 
2. 基 本 转换 
根据 学 生 列表 返回 名 称 列表 ， 传 统 上 的 代码 一 般 是 这 样 : 


zp 
EE 


List<String> nameList = new ArrayList<>(students.size()); 
for(Student t : students) { 
nameList.add(t.getName( )); 


使 用 Stream API， 代 码 可 以 这 样 : 


List<String> nameList = Students,stream( ) 
.map(Student::getName).collect(Collectors.toList()); 


这 里 使 用 了 Stream 的 map 了 汞 数 ， 它 的 参数 古 一 个 Function 函 数 式 接 
口 ， 这 里 传递 了 方法 引用 。 


3. 基 本 的 过 滤 和 转换 组 合 
返回 90 分 以 上 的 学 生 名 称 列表 ， 传 统 上 的 代码 一 般 是 这 样 : 


List<String> nameList = new ArrayList<>(); 
for(Student t : students) { 
if(t.getSscore() > 90) { 
nameList.add(t.getName( )); 


} 
} 

使 用 函数 式 数据 处 理 的 思路 ， 可 以 将 这 个 问题 分 解 为 由 两 个 基本 
函数 实现 : 

1) 过 滤 : 得 到 90 分 以 上 的 学 生 列表 。 

2) 转换 : 将 学 生 列表 转换 为 名 称 列表 。 

使 用 Stream API， 可 以 将 基本 函数 filter () 和 map () 结合 起 来 ， 
代码 可 以 这 样 : 


List<String> above90Names = students.stream() 
.filter(t->t.getScore()>90).map(Student::getName) 


.Collect(Collectors.toList()); 


这 种 组 合 利 用 基本 函数 、 声 明 式 实现 集合 数据 处 理 功能 的 编程 风 
格 ， 殊 是 函数 式 数 据 处 理 。 

代码 更 为 直观 易 读 了 ， 但 你 可 能 会 担心 它 的 性 能 有 问题 。filter 
() 和 map () 都 需要 对 流 中 的 每 个 元 素 操 作 一 次 ， 一 起 使 用 会 不 会 
谍 需 要 授 历 两 次 呢 ? 管 案 古 否定 的 ， 只 需要 一 次 。 实 际 上 ， 调 用 filter 
() 和 map () 都 不 会 执行 任何 实际 的 操作 ， 它 们 只 是 在 构建 操作 的 


流水 线 ， 调 用 collect 才 会 触发 实际 的 罗 历 执行 ， 在 一 次 过 历 中 完成 过 
滤 、 转 换 以 及 收集 结果 的 任务 。 


像 filter 和 map 这 种 不 实际 触发 执行 、 用 于 构建 流水 线 、 返 回 Stream 
的 操作 称 为 中 间 操 作 、(intermediate operation) ， 而 像 collect 这 种 触发 
实际 执行 、 返 回 具体 结果 的 操作 称 为 终端 操作 (terminal 
operation) 。Stream API 中 还 有 更 多 的 中 间 和 终端 操作 ， 下 面 我 们 具体 


介绍 。 


26.2.2” 中间 操 作 


除了 filter 和 map，Stream API 的 中 间 操 作 还 有 distinct 、sorted 、 
skip 、 limit 、 peek ~、 mapToLong ~ mapToInt 、 mapToDouble 、 flatMap 
等 ， 我 们 逐个 介绍 。 


1.distinct 


distinct 返 回 一 个 新 的 Stream， 过 小 重复 的 元 素 ， 只 留 下 唯一 的 元 
素 ， 是 否 重复 是 根据 equals 方 法 来 比较 的 ，distinct 可 以 与 其 他 函数 (如 
filter、map) 结合 使 用 。 比 如 ， 运 回 字符 串 列表 中 长 度 小 于 3 的 字符 
串 、 转 换 为 小 写 、 只 保留 唯一 的 ， 代 码 可 以 为 : 


List<String> list = Arrays.asList(new String[]{"abc","def","hello","Abc"}); 

List<String> retList = list.stream() 
.filter(s->s.length()<=3).map(String::toLowerCase).distinct() 
.Collect(Collectors.toList()); 


虽然 都 是 中 间 操 作 ， 但 distinct 与 filter 和 map 是 不 同 的 。fiter 和 map 
都 是 无 状态 的 ， 对 于 流 中 的 每 一 个 元 素 ， 处 理 都 是 独立 的 ， 处 理 后 即 
交 给 流水 线 中 的 下 一 个 操作 ; distinct 不 同 ， 它 是 有 状态 的 ， 在 处 理 过 
程 中 ， 它 需要 在 内 部 记录 之 前 出 现 过 的 元 素 ， 如 果 已 经 出 现 过 ， 即 重 
复元 素 ， 它 就 会 过 滤 挥 ， 不 传递 给 流水 线 中 的 下 一 个 操作 。 对 于 顺序 
流 ， 内 部 实现 时 ，distinct 操 作 会 使 用 HashSet 记 录 出 现 过 的 元 素 ， 如 采 
流 是 有 顺序 的 ， 需 要 保留 顺序 ， 会 使 用 LinkedHashSet 。 


2.sorted 


有 两 个 sorted 方 法 : 


Stream<T> Sorted() 
Stream<T> sorted(Comparator<? super T> comparator ) 


它们 都 对 流 中 的 元 素 排序 ， 都 返回 一 个 排序 后 的 Stream。 第 一 个 
方法 假定 元 素 实 现 了 Comparable 接 口 ， 第 二 个 方法 接受 一 个 目 定义 的 
Comparator。 比 如， 过 滤 得 到 90 分 以 上 的 学 生 ， 然 后 按 分 数 从 高 到 低 
排序 ， 分 数 一 样 的 按 名 称 排 友 ， 代 码 为 : 


List<Student> list = students.stream().filter(t->t.getScore( )>90) 
.Sorted(Comparator.comparing(Student::getScore) 
.reversed().thenComparing(Student::getName)) 
.collect(Collectors.toList()); 


这 里 ， 使 用 了 Comparator 的 comparing、reversed 和 thenComparing 
构建 了 Comparator。 


与 distinct 一 样 ，sorted 也 是 一 个 有 状态 的 中 间 操作 ， 在 处 理 过 程 
中 ， 需 要 在 内 部 记录 出 现 过 的 元 素 。 其 不 同 是 ， 每 磁 到 流 中 的 一 个 元 
素 ，distinct 都 能 立即 做 出 处 理 ， 要 么 过 滤 ， 要 么 马上 传递 给 下 一 个 操 
作 ，sorted 需 要 先 排序 ， 为 了 排序 ， 它 需要 先 在 内 部 数组 中 保存 磁 到 的 
每 一 个 元 素 ， 到 流 结尾 时 再 对 数组 排序 ， 然 后 再 将 排序 后 的 元 素 逐个 
传递 给 流水 线 中 的 下 一 个 操作 。 


3.Skip/limit 
它们 的 定义 为 : 


Stream<T> skip(long n) 
Stream<T> limit(long maxSize) 


skip 跳 过 流 中 的 n 个 元 素 ， 如 果 流 中 元 素 不 足 n 个 ， 返 回 一 个 空 
流 ，limit 限 制 流 的 长 度 为 maxSize。 比 如 ， 将 学 生 列表 按照 分 数 排序 ， 
返回 第 3 名 到 第 5 名 ， 代 码 为 : 


List<Student> list = students.stream() 
.Sorted(Comparator.comparing(Student::getScore).reversed()) 
.Skip(2).1imit(3).collect(Collectors.toList()); 


skip 和 1limit 都 是 有 状态 的 中 间 操 作 。 对 前 n 个 元 素 ，skip 的 操作 就 

过 滤 ， .Skip 处 是 传 放 全 流水线 中 的 下 一 个 操作 。 
人 需要 处 理 流 中 的 所 有 元 素 ， 只 要 处 理 的 元 素 
个 数 达 到 maxSize， Ri 要 处 理 了 ， 这 种 可 以 提前 结束 的 
操作 称 为 短路 操作 。 


skip 和 1limit 只 能 根据 元 素数 目 进行 操作 ，Java 9 增加 了 两 个 新 方 
法 ， 相 当 于 更 为 通用 的 skip 和 limit: 


// 通 用 的 skip， 在 谓词 返回 为 true 的 情况 下 一 直 进 行 skip 操 作 ， 直 到 某 次 返回 false 
default Stream<T> dropwhile(Predicate<? SuUper T> predicate) 
// 通 用 的 1imit， 在 谓词 返回 为 true 的 情况 下 一 直接 5 到 某 次 返回 false 


default Stream<T> takewhile(Predicate<? super T> predicate) 


4.peek 
peek 的 定义 为 : 


Stream<T> peek(Consumer<? super T> action) 


它 返 回 的 流 与 之 前 的 流 是 一 样 的 ， 没 有 变化 ， 但 它 提供 了 一 个 
Consumer， 会 将 流 中 的 每 一 个 元 素 传 给 该 Consumer。 这 个 方 法 的 主要 
的 是 支持 调试 ， 可 以 使 用 该 方法 观察 在 流水 线 中 流转 的 元 素 ， 比 

0D: 


List<String> above9ONames = Students.stream( ) .filter(t->t.getScore()>90) 
.peek(System.out::printilin).map(Student: :getName) 
.Collect(Collectors.toList()); 


5.mapToLong/mapToInt/mapToDouble 


map 函 数 接受 的 参数 是 一 个 Function<T，R>， 为 避免 装 箱 / 拆 箱 
提高 性 能 ，Stream 还 有 如 下 返回 基本 类 型 特定 流 的 方法 ; 


DoubleStream mapToDouble(ToDoubleFunction<? super T> mapper) 
IntStream mapToInt(ToIntFunction<? super T> mapper) 
LongStream mapToLong(ToLongFunction<? super T> mapper) 


DoubleStream/IntStream/LongStream 是 基本 类 型 特定 的 流 ， 有 一 些 
专门 的 更 为 高 效 的 方法 。 比 如 ， 求 学 生 列表 的 分 数 总 和 ， 代 码 为 : 


double sum = students.stream().mapToDouble(Student::getScore).sum(); 


6.flatMap 


flatMap 的 定义 为 : 


<R> Stream<R> flatMap(Function<? super T, ? extends Stream<? extends R>> mapper) 


它 接 受 一 个 函数 mapper， 对 流 中 的 每 一 个 元 素 ， He 
0 然后 把 新 生成 流 的 每 一 个 元 素 传 递 给 
保 比 0D: 


List<String> lines = Arrays.asList(new String[]{ 
"hello abc", 1 少 马 编程 "}); 
List<String> words = lines.stream() 
flatMap(line -> Arrays.stream(line.split("\\s+"))) 
.Collect(Collectors.toList()); 
System.out.println(words); 


这 里 的 mapper 将 一 行 字 符 串 按 空 日 特 分 隔 为 了 一 个 单词 流 ， 
Arrays.stream 可 以 将 一 个 数组 转换 为 一 个 流 ， 输 出 为 : 


[hello，abc， 老 马 ， 编 程 ] 


可 以 看 出 ， 实 际 上 ，flatMap 完 成 了 一 个 1 到 n 的 映射 。 


26.2.3 终端 操作 


中 间 操 作 不 触发 实际 的 执行 ， 返 回 值 是 Steam， 而 终端 操作 触发 
执行 ， 返 回 一 个 具体 的 值 ， 除 了 collect，Stream API 的 终端 操作 还 有 
max、min、count、allMatch、anyMatch、noneMatch、findFirst、 
findAny、forEach、toArray、reduce 等 ， 我 们 逐个 介绍 。 


1.max/min 


max/min 的 定义 为 : 


Optional<T> max(Comparator<? Super T> comparator) 
Optional<T> min(Comparator<? Super T> comparator ) 


它们 返回 流 中 的 最 大 值 /最 小 值 ， 它 们 的 返回 值 类 型 是 
Optional<T> ， 而 不 是 T。 


java.util.Optional 是 Java 8 引入 的 一 个 狐 类 ， 它 是 一 个 沁 型 容器 类 ， 
内 部 只 有 一 个 类 型 为 T 的 单一 变量 value， 可 能 为 null， 也 可 能 不 为 
null。Optional 有 什么 用 呢 ? 它 用 于 准确 地 传递 程序 的 语义 ， 它 清楚 地 
表明 ， 其 代表 的 值 可 能 为 null， 程 序 员 应 该 进行 适当 的 处 理 。 


Optional 定 义 了 一 些 方法 ， 比 如 ; 


//value 不 为 hull 时 返回 true 

public boolean isPresent() 

// 返 回 实际 的 值 ， 如 果 为 hull1， 抛 出 异常 NoSuchElementException 
public T get() 

// 如 果 value 不 为 hull1， 返 回 value， 否 则 返回 other 

public T orElse(T other) 

// 构 建 一 个 空 的 0ptional，value 为 null 

public static<T> Optional<T> empty() 

// 构 建 一 个 非 空 的 0ptional， 参 数 value 不 能 为 null 

public static <T> Optional<T> of(T value) 

// 构 建 一 个 Optional， 参 数 value 可 以 为 nul1， 也 可 以 不 为 nul1 
public static <T> Optional<T> ofNullable(T value) 


在 max/min 的 例子 中 ， 通 过 声明 返回 值 为 Optional， 我 们 可 以 知道 
具体 的 返回 值 不 一 定 存 在 ， 这 发 生 在 流 中 不 含 任何 元 素 的 情况 下 。 


看 个 简单 的 例子 ， 返 回 分 数 最 高 的 学 生 ， 代 码 为 : 


Student student = students.stream() 
.max(Comparator.comparing(Student::getSscore).reversed()).get() 


这 里 ， 假 定 students 不 为 空 。 


2.count 


count 很 简单 ， 束 是 返回 流 中 元 素 的 个 数 。 比 如 ， 统 计 大 于 90 分 的 
学 生 个 数 ， 代 码 为 : 


3.allMatch/anyMatch/noneMatch 


这 几 个 函数 都 接受 一 个 谓词 Predicate， 返回 一 个 boolean 值 ， 用 于 
判定 流 中 的 元 素 是 否 满足 一 定 的 条 件 。 它 们 的 区 别 是 


long above90Count = students.stream().filter(t->t.getScore()>90).count() 


allMatch: 只 有 在 流 中 所 有 元 素 都 满足 条 件 的 情况 下 才 返 回 true。 


-anyMatch: 只 要 流 中 有 一 个 元 素 满 足 条 件 就 返回 true 。 

noneMatch: 只 有 流 中 所 有 元 素 都 不 满足 条 件 才 返回 true 。 
如果 流 为 空 ， 那 么 这 几 个 函数 的 返回 值 都 是 true 。 
比如 ， 判 断 是 不 是 所 有 学 生 都 及 格 了 (不 小 于 60 分 ) 


， 代 码 可 以 


boolean allPass = students,.stream().allMatch(t->t.getScore( )>=60); 


这 几 个 操作 都 是 短路 操作 ， 不 一 定 需要 处 理 所 有 元 素 就 能 得 出 结 
果 ， 比如 ， 对 于 all-Match ， 只 要 有 一 | 元 素 不 满足 条 < 件 ， 就 能 返回 


false。 


4.findFirst/findAny 


它们 的 定义 为 : 


Optional<T> findFirst() 
Optional<T> findAny() 


它们 的 返回 类 型 都 是 Optional， 如 果 流 为 空 ， 返 回 Optional.empty 
() 。findFirst 返 回 第 一 个 元 素 ， 而 findAny 返 回 任 一 元 素 ， 它 们 都 是 
短路 操作 。 随 便 找 一 个 不 及 格 的 学 生 ， 代 码 可 以 为 : 


Optional<Student> student = students.stream().filter(t->t.getScore( )<60) 
.findAny( ); 
if(student. a 
// 处 理 不 及 格 的 学 
} 


5.forEach 
有 两 个 forEach 方 法 : 


void forEach(Consumer<? Super T> action) 
void forEachordered(Consumer<? Super T> action) 


它们 都 接受 一 个 Consumer， 对 流 中 的 每 一 个 元 素 ， 传 递 元 素 给 
Consumer。 区 别 在 于 : 在 并 行 流 中 ，forEach 不 保证 处 理 的 顺序 ， 而 
forEachOrdered 会 保证 按照 流 中 元 素 的 出 现 顺序 进行 处 理 。 


比如 ， 逐 行 打印 大 于 90 分 的 学 生 ， 代 码 可 以 为 : 


students.stream().filter(t->t.getScore()>90).forEach(System.out::println); 


6.toArray 
toArray 将 流转 换 为 数组 ， 有 两 个 方法 : 


Object[] toArray() 
<A> A[] toArray(IntFunction<A[]> generator) 


不 市 参数 的 toArray 返 回 的 数组 类 型 为 Object[]， 这 通常 不 是 期 望 的 
结果 ， 如 有 果 希 望 得 到 正确 类 型 的 数组 ， 需 要 传递 一 个 类 型 为 
IntFunction 的 generator。IntFunction 的 定义 为 : 


public interface IntFunction<R> { 
R apply(int value),; 


generator 接 受 的 参数 是 流 的 元 素 个 数 ， 它 应 该 返回 对 应 大 小 的 正 
确 类 型 的 数组 。 


比如 ， 获 取 90 分 以 上 的 学 生 数 组 ， 代 码 可 以 为 : 


Student[] above90OArr = Students.stream( ) .filter(t->t.getScore()>90) 
‘toArray(Student[]::new); 


Student[]: : new 束 是 一 个 类 型 为 IntFunction<Student[]> 的 
generator ° 


7.reduce 


reduce 代 表 归 约 或 者 叫 折 县 ， 它 是 max/min/count 的 更 为 通用 的 范 
数 ， 将 流 中 的 元 素 归 约 为 一 个 值 。 有 三 个 reduce 芳 数 : 


Optional<T> reduce(BinaryOperator<T> accumulator); 

T reduce(T identity, BinaryOperator<T> accumulator ); 

<U> U reduce(U identity, BiFunction<U, ? super T, U> accumulator, 
BinaryOperator<U> combiner); 


第 一 个 reduce 函 数 基本 等 同 于 调用 : 


boolean foundAny = false; 
T result = null; 
for(T element : this stream) { 
if(!foundAny) { 
foundAny = true; 
result = element,; 


else 
result = accumulator.apply(result, element); 


} 
return foundAny ? Optional.of(result) : Optional.empty(); 


比如 ， 使 用 reduce 芳 数 求 分 数 最 融 的 学 生 ， 代 码 可 以 为 : 


Student topStudent = students.stream().reduce((accu, t) -> { 
if(accu.getScore() >= t.getScore()) { 
return accu; 
} else { 
return t; 


} 
}).get(); 


第 二 个 reduce 范 数 多 了 一 个 identity 参 数 ， 表 示 初 始 值 ， 它 基本 等 
同 于 调用 : 


T result = identity; 
for(T element : this stream) 

result = accumulator.apply(result, element) 
return result; 


第 一 个 和 第 二 个 reduce 函 数 的 返回 类 型 只 能 是 流 中 元 素 的 类 型 ， 
而 第 三 个 reduce 函 数 更 为 通用 ， 它 的 归 约 类 型 可 以 自 定义 ， 男 外 ， 它 
多 了 一 个 combiner 参 数 。combiner 用 在 并 行 流 中 ， 用 于 合并 子 线程 的 
结果 。 对 于 顺序 流 ， 它 基本 等 同 于 调用 : 


U result = identity; 
for(T element : this stream) 

result = accumulator.apply(result, element) 
return result; 


注意 与 第 二 个 reduce 函 数 相 区 分 ， 它 的 结果 类 型 不 是 T， 而 是 U。 
比如 ， 使 用 reduce 范 数 计算 学 生 分 数 的 和 ， 代 码 可 以 为 : 


double sumScore = students.stream().reduce(0d, 
(sum, t) -> Sum += t,getScore()， 
(sum1, sum2) -> Sum1 += sum2 


); 


从 以 上 可 以 看 出 ，reduce 函 数 虽 然 更 为 通用 ， 但 比较 费解 ， 难 以 
使 用 ， 一般 情 况 下 应 该 优先 使 用 其 他 函数 。collect 芳 数 比 reduce 函 数 更 
为 通用 、 强 大 和 易 用 ， 关 于 它 ， 我 们 稍 后 再 详细 介绍 。 


26.2.4 构建 流 


前 面 我 们 主要 使 用 的 是 Collection 的 stream 方 法 ， 换 做 
parallelStream 方 法 ， 束 会 使 用 并 行 流 ， 接 口 方 法 都 是 通用 的 。 但 并 行 
流 内 部 会 使 用 多 线程 ， 线 程 个 数 一 般 与 系统 的 CPU 核 数 一 样 ， 以 充分 
利用 CPU 的 计算 能 力 。 


进一步 来 说 ， 并 行 流 内 部 会 使 用 Java 7 引入 的 forwjoin 框 架 ， 即 处 
理由 fork 和 和 join 两 个 阶段 组 成 ，fork 束 是 将 要 处 理 的 数据 拆 分 为 小 块 ， 
多 线程 按 小 块 进行 并 行 计算 ，join 束 是 将 小 块 的 计算 结果 进行 合并 ， 
0 ° 使 用 并 行 流 ， 不 需要 任何 线程 管理 的 代码 ， 整 
能 实现 并 行 。 


除了 通过 Collection 接 口 的 stream/parallelStream 获 取 流 ， 还 有 一 些 
其 他 方式 可 以 获取 流 。Arrays 有 一 些 stream 方 法 ， 可 以 将 数组 或 子 数组 
转换 为 流 ， 比 如 : 


public static IntStream stream(int[] array) 

public static DoubleStream stream(double[] array, int startInclusive, 
int endExclusive) 

public static <T> Stream<T> stream(T[] array) 


输出 当前 目录 下 所 有 普通 文件 的 名 字 ， 代 码 可 以 为 : 


File[] files = new File(".").1listFiles(); 
Arrays.stream(files).filter(File::isFile).map(File: :getName) 
.forEach(System.out: :printiln); 


Stream 也 有 一 些 静态 方法 ， 可 以 构建 流 ， 比 如 ; 


// 返 回 一 个 空 流 

public static<T> Stream<T> empty() 
// 返 回 只 包含 个 元 素 t 的 流 

public static<T> Stream<T> of(T t) 


// 返 回 包含 多 个 元 素 vValues 的 流 

public static<T> Stream<T> of(T... values) 

// 通 过 Supplier 生 成 流 ， 流 的 元 素 个 数 是 无 限 的 

public static<T> Stream<T> generate(Supplier<T> s) 
// 同 样 生成 无 限 流 ， 第 一 个 元 素 为 seed， 第 二 个 为 f(seed)， 第 三 个 为 f(f(seed) ) ， 以 此 类 推 


public static<T> Stream<T> iterate(final T seed, final Unaryoperator<T> f) 


输出 10 个 随机 数 ， 代 码 可 以 为 : 


Stream,generate(()->Math.random( )),1Limit(10),forEach(System,out::printJln); 


输出 100 个 递增 的 奇效， 代码 可 以 为 : 


Stream.iterate(1，t->t+2). imit(100).forEach(System.out::println)， 


26.2.5” 玉 数 式 数 据 处 理 思 维 


可 以 看 出 ， 使 用 Stream API 处 理 数 据 集合 ， 与 直接 使 用 容器 类 API 
处 理 数 据 的 思路 是 完全 不 一 样 的 。 流 定义 了 很 多 数据 处 理 的 基本 画 
数 ， 对 于 一 个 具体 的 数据 处 理 问 题 ， 解 决 的 主要 思路 束 是 组 合 利用 这 
些 基本 函数 ， 以 声明 式 的 方式 简洁 地 实现 期 望 的 功能 ， 这 种 思路 就 是 
函数 式 数 据 处 理 思维 ， 相 比 直接 利用 容 吉 类 API 的 命令 式 思维 ， 思 考 
的 层次 更 高 。 


Stream API 的 这 种 思路 也 不 是 新 发 明 ， 它 与 数据 库 查 询 语言 SQL 
是 很 像 的 ， 都 是 声明 式 地 操作 集合 数据 ， 很 多 函数 都 能 在 SQL 中 找到 
对 应 ， 比 如 fiter 对 应 SQL 的 where，sorted 对 应 order by 等 。SQL 一 般 都 
位 生 J 个 组 ° 


Stream API 也 与 各 种 基于 Unix 系 统 的 管道 命令 类 似 。 熟悉 Unix 系 
统 的 都 知道 ，Unix 有 很 多 命令 ， 大 部 分 命令 只 是 专注 于 完成 一 件 事 
情 ， 但 可 以 通过 管道 的 方式 将 多 个 命令 链接 起 来 ， 完 成 一 些 复 杂 的 功 
能 ， 比 如 : 


cat nginx_access,1og | awk '{print $1}' | sort | uniq -c | sort -rnk 1 | head -n 
20 


以 上 命令 可 以 了 分 析 nginx 访 问 日 志 ， 统计 出 访问 次 数 最 多 的 前 20 个 
IP 地 址 及 其 访问 次 数 。 具 体 来 说 ，cat 命 令 输出 nginx 访 问 日 志 到 流 ， 一 
行为 一 个 元 素 ，awk 输 出 行 的 第 一 列 ， 这 里 为 IP 地 址 ，sort 按 IP 进 行 排 
序 ，"uniq-c" 按 了 统计 计数 ，"sort-rnk 1" 按 计数 从 高 到 低 排序 ，"head-n 
20" 输 出 前 20 行 。 


26.3 ”函数 式 数据 处 理 : 强大 方便 的 收集 器 


对 于 collect 方 法 ， 前 面 只 是 演示 了 其 最 基本 的 应 用 ， 它 还 有 很 多 
强大 的 功能 ， 比 如 ， 可 以 分 组 统计 汇总 ， 实 现 类 似 数据 库 查 询 语言 
SQL 中 的 group by 功能 。 上 有 具体 都 有 哪些 功能 ? 有 什么 用 ? 如 何 使 用 ? 基 
本 原理 是 什么 ? 让 我 们 逐步 进行 探讨 ， 先 来 进一步 理解 collect 方 法 。 


26.3.1 理解 collect 
在 上 节 中 ， 过 滤 得 到 90 分 以 上 的 学 生 列表 ， 代 码 是 这 样 的 : 


List<Student> above90List = students.stream().filter(t->t.getScore()>90) 
.Collect(Collectors.toList()); 


最 后 的 collect 调 用 看 上 去 很 神奇 ， 它 到 底 是 怎么 把 Stream 转 换 为 
List<Student> 的 呢 ? 先 看 下 collect 方 法 的 定义 : 


<R, A> R collect(Collector<? super T, A, R> collector) 


它 接 受 一 个 收集 器 collector 作 为 参数 ， 类 型 是 Collector， 这 是 一 个 
接口 ， 它 的 定义 基本 上 是 : 


public interface Collector<T, A, R> { 
Supplier<A> supplier(); 
BiConsumer<A, T> accumulator(); 
BinaryOperator<A> combiner(); 
Function<A, R> finisher(); 
Set<Characteristics> characteristics(); 


在 顺序 流 中 ，collect 方 法 与 这 些 接口 方法 的 交互 大 概 是 这 样 的 : 


// 首 先 调 用 工厂 方法 supplier 创 建 一 个 存放 人 处理 状态 的 容器 container， 类 型 为 A 

A container = collector.supplier().get(); 

// 对 流 中 的 每 一 个 元 素 t， 调 用 累加 器 accumulator， 参 数 为 累计 状态 container 和 当前 元 素 t 
for(T t : data) 


collector.accumulator().accept(container, t); 
// 最 后 调用 finisher 对 累计 状态 container 进 行 可 能 的 调整 ， 类 型 转换 (A 转换 为 R) ， 返 回 台 
return collector.finisher().apply(container); 


combiner 只 在 并 行 流 中 有 用 ， 用 于 合并 部 分 结果 。characteristics 用 
于 标示 收集 器 的 特征 ，Collector 接 口 的 调用 者 可 以 利用 这 些 特征 进行 
一 些 优化 。Characteristics 是 一 个 枚 举 ， 有 三 个 值 : CONCURRENT、 
UNORDERED 和 和 IDENTITY _FINISH， 它 们 的 含义 我 们 后 面 通 过 例子 
简要 说 明 ， 目 前 可 以 忽略 。 


Collectors.toList () 具体 是 什么 呢 ? 看 下 代码 : 


public static <T> 
Collector<T, ?, List<T>> toList() { 
return new CollectorIimpl<>( (Supplier<List<T>>) ArrayList::new, List::add, 
(left, right) -> 
{ left.addAll(right); return left; }, 
CH_ID); 


它 的 实现 类 是 CollectorImpl， 这 是 Collectors 内 部 的 一 个 私有 类 ， 
实现 很 简单 ， 主要 就 是 定义 了 两 个 构造 方法 ， 接 受 芳 数 式 参数 并 赋值 
给 内 部 变量 。 对 toList 来 说 : 


1) supplier 的 实现 是 ArrayList: : new， 也 就 是 创建 一 个 ArrayList 
作为 容器 。 

2) accumulator 的 实现 是 List: : add， 也 就 是 将 磁 到 的 每 一 个 元 素 
加 到 列表 中 。 

3) 第 三 个 参数 是 combiner， 表 示 合 并 结果 。 


4) 第 四 个 参数 CH ID 是 一 个 静态 变量 ， 只 有 一 个 特征 
IDENTITY_FINISH， 表 示 finisher 没 有 什么 事情 可 以 做 ， 就 是 把 累计 状 
态 container 直 接 返 回 。 


也 就 是 说 ，collect (Collectors.toList () ) 背后 的 伪 代 码 如 下 所 
个: 


List<T> container = new ArrayList<>(); 
for(Tt : data) 

container .add(t); 
return container; 


26.3.2 ”容器 收集 属 


与 toList 类 似 的 容 亏 收集 各 还 有 toSet、 toCollection 、toMap 等 ， 我 
们 来 进行 介绍 。 


1.toSet 


toSet 的 使 用 与 toList 类 似 ， 只 是 它 可 以 排 重 ， 束 不 举例 了 。toList 
背后 的 容器 是 ArrayList，toSet 背 后 的 容器 是 HashSet， 其 代码 为 : 


public static <T> 
Collector<T, ?, Set<T>> toSet() { 
return new CollectorIimpl<>( (Supplier<Set<T>>) HashSet': :new, Set::add, 
(left, right) -> 
{ left.addAll(right); return left; }, 
CH_UNORDERED_ID); 


CH_UNORDERED_ID 是 一 个 静态 变量 ， 它 的 特征 有 两 个 :一 个 
是 IDENTITY_FINISH， 表 示 返 回 结果 即 为 Supplier 创 建 的 HashSet; 另 
一 个 是 UNORDERED， 表 示 收 集 器 不 会 保留 顺序 ， 这 也 容易 理解 ， 
为 背后 容器 是 HashSet 。 


2.toCollection 


toCollection 是 一 六 通用 的 容器 收集 器 ， 可 以 用 于 任何 Collection 接 
口 的 实现 类 ， 它 接受 一 个 工厂 方法 Supplier 作 为 参数 ， 具 体 代 码 为 : 


public static <T, C extends Collection<T>> 
Collector<T, ?, C> toCollection(Supplier<C> collectionFactory) { 
return new CollectorIimpl<>(collectionFactory, Collection<T>::add, 
(ri, r2) -> { ri.addAll(r2); return ri; }, 
cH_ID); 


比如 ， 如 果 和 希望 排 重 但 又 希望 保留 出 现 的 顺序 ， 可 以 使 用 
LinkedHashSet，Collector 可 以 这 么 创建 : 


LinkedHashSet，Collector 可 以 这 么 创建 : 
Collectors.toCollection(LinkedHashSet: :new) 


3.toMap 


toMap 将 元 素 流 转换 为 一 个 Map， 我 们 知道 ，Map 有 刍 和 值 两 部 
分 ，toMap 至 少 需 要 两 个 芳 数 参数 ， 一 个 将 元 素 转 换 为 键 ， 男 一 个 将 
元 素 转 换 为 值 ， 其 基本 定义 为 : 


public static <T, K, U> Collector<T, ?, Map<K,U>> toMap( 
Function<? super T, ? extends K> keyMapper, 
Function<? super T, ? extends U> valueMapper) 


返回 结果 为 Map<K，U>，keyMapper 将 元 素 转 换 为 键 ， 
valueMapper 将 元 素 转 换 为 值 。 比 如 ， 将 学 生 流 转换 为 学 生 名 称 和 分 数 
的 Map， 代 码 可 以 为 : 


Map<String,Double> nameScoreMap = students.stream().collect( 
Collectors.toMap(Student::getName, Student::getScore)); 


这 里 ，Student: : getName 是 keyMapper，Student: : getScore 是 
ValueMapper ° 


实践 中 ， 经 党 需要 将 一 个 对 象 列 表 按 主键 转 换 为 一 个 Map， 以 便 
以 后 按照 主键 进行 快速 查找 ， 比 如 ， 假 定 Student 的 主键 是 id， 硕 望 转 
换 学 生 流 为 学 生 id 和 学 生 对 象 的 Map， 代 码 可 以 为 : 


Map<String, Student> byIdMap = students.stream().collect( 
Collectors.toMap(Student::getId, t -> t)); 


t->t 是 valueMapper， 表示 值 就 是 元 素 本 刁 。 这 个 函数 用 得 比较 
多 ， 接 口 Function 定 义 了 一 个 静态 函数 identity 表 示 它 。 也 丈 是 说 ， 上 
面 的 代码 可 以 蔡 换 为 : 


Map<String, Student> byIdMap = students.stream().collect( 
Collectors.toMap(Student: :getId, Function.identity())); 


i 
常 ， 比 如 : 


Map<String,Integer> StrLenMap = Stream,.of("abc","hello","abc").collect( 
Collectors.toMap(Function.identity(), t->t.length())); 


希望 得 到 字符 串 与 其 长 度 的 Map， 但 由 于 包含 重复 字符 串 "abc"， 
程序 会 抛 出 异常 。 这 种 情况 下 ， 我 们 希望 的 是 程序 忽略 后 面 重 复出 现 
的 元 素 ， 这 时 ， 可 以 使 用 男 一 个 toMap 函 数 : 


public static <T, K, U> Collector<T, ?, Map<K,U>> toMap( 
Function<? super T, ? extends K> keyMapper, 
Function<? super T, ? extends U> valueMapper, 
BinaryOperator<U> mergeFunction) 


相 比 前 面 的 toMap， 它 接受 一 个 额外 的 参数 mergeFunction， 它 用 
于 处 理 冲突 ， 在 收集 一 个 新 元 素 时 ， 如 果 新 元 素 的 键 已 经 存在 了 ， 系 
统 会 将 新 元 素 的 值 与 键 对 应 的 旧 值 一 起 传递 给 mergeFunction 得 到 一 个 
值 ， 然 后 用 这 个 值 给 键 赋值 。 


对 于 前 面 字符 串 长 度 的 例子 ， 新 值 与 旧 值 其 实 是 一 样 的 ， 我 们 可 
以 用 任意 一 个 值 ， 代 码 可 以 为 : 


Map<String,Integer> StrLenMap = Stream,.of("abc","hello","abc").collect( 
Collectors.toMap(Function.identity(), 
t->t.length(), (oldValue,value)->value)); 


有 时， 我 们 可 能 希望 合并 新 值 与 旧 值 ， 比 如 一 个 联系 人 列表 ， 对 
同 的 联系 人 ， 我 们 希望 合并 电话 号 码 ，mergeFunction 可 以 定义 


Binaryoperator<String> mergeFunction = (oldPhone,phone)->oldPhone+", "+phone; 


toMap 还 有 一 个 更 为 通用 的 形式 : 


public static <T, K, U, M extends Map<K，U>> Collector<T, ?, M> toMap( 
Function<? super T, ? extends K> keyMapper, 
Function<? super T, ? extends U> valueMapper, 
BinaryOperator<U> mergeFunction, Supplier<M> mapSupplier) 


相 比 前 面 的 toMap， 多 了 一 个 mapSupplier， 它 是 Map 的 工厂 方 
法 ， 对 于 前 面 的 两 个 toMap， 其 mapSupplier 其 实 是 HashMap: : new。 
我 们 知道 ，HashMap 是 没有 任何 顺序 的 ， 如 果 希 望 保持 元 素 出 现 的 顺 
可 以 替换 为 LinkedHashMap， 如 果 硕 望 收集 的 结果 排序 ， 可 以 使 
TreeMap。 


toMap 主 要 用 于 顺序 流 ， 对 于 并 发 流 ， Collectors 有 专门 的 名 为 
toConcurrentMap 的 收集 器 ， 它 内 部 使 用 ConcurrentHashMap， 用 法 类 
似 ， 具体 我 们 就 不 讨论 了 。 


26.3.3 ”字符 串 收 集 器 


除了 将 元 素 流 收集 到 容器 中 ， 男 一 个 常见 的 操作 古 收 集 为 一 个 子 
获取 所 有 的 学 生 名 称 ， ”用 逗号 过 由 起 传统 上 代码 看 


StringBuilder sb = new StringBuilder(); 
for(Student t : Students ){ 
Ifl(sb.Jlength()>0){ 
sb.append("™,"); 


} 
sb.append(t.getName()); 


return sb.toString(); 


针对 这 种 常见 的 需求 ，Collectors 提 供 了 joining 收 集 器 ， 比 如 : 


public static Collector<CharSequence, ?, String> joining() 
public static Collector<CharSequence, ?, String> joining( 
CharSequence delimiter, CharSequence prefix, CharSequence suffix) 


第 一 个 束 是 侧 单 地 把 元 素 连接 起 来 ， 第 二 个 文 持 一 个 分 隅 符 ， 还 
可 以 给 整个 结果 字符 串 加 前 纵 和 后 缀 ， 比 如 : 


String result = Stream.of("abc"," 老 马 ", "hello") 
.collect(Collectors.joining("™,", "[", "]")); 
System.out.printjn(result); 


输出 为 : 
[abc, 老 马 , hello] 


joining 的 内 部 也 利用 了 StringBuilder。 比 如 ， 第 一 个 joining 函 数 的 
代码 为 : 


public static Collector<CharSequence, ?, String> joining() { 
return new CollectorIimpl<CharSequence, StringBuilder, String>( 
StringBuilder: :new, StringBuilder::append, 
(ri, r2) -> { ri.append(r2); return ri; }, 
StringBuilder::toString, CH_NOID); 


} 
supplier 是 StringBuilder: : new，accumulator 征 StringBuilder: 
append，finisher 是 StringBuilder: : toString，CH_NOID 表 示 特 征集 为 
全 O 


26.3.4 分 组 


分 组 类 似 于 数据 库 查询 语言 SQL 中 的 group by 语句 ， 它 将 元 素 流 中 
的 每 个 元 素 分 到 一 个 组 ， 可 以 针对 分 组 再 进行 处 理 和 收集 。 分 组 的 功 
能 比较 强大 ， 我 们 逐步 来 说 明 。 


为 便于 举例 ， 我 们 先 修改 下 学 生 类 Student， 增 加 一 个 字段 grade 表 
示 年 级 : 


public Student(String name，String grade, double Score) { 
this.name = name; 
this.grade = grade,; 


this,Score = score; 


示例 学 生 列 表 students 改 为 : 


static List<Student> students = Arrays.asList(new Student[] { 
new Student("zhangsan", "1", 91d), new Student("lisi", "2", 89d), 
new Student("wangwu", "1", 50d), new Student("zhaoliu", "2", 78d), 
new Student("sunqi", "1", 59d)}); 


1. 基 本 用 法 
最 基本 的 分 组 收集 器 为 : 


public static <T, K> Collector<T, ?, Map<K, List<T>>> 
groupingBy(Function<? Super T, ? extends K> classifier) 


参数 是 一 个 类 型 为 Function 的 分 组 絮 classifier， 它 将 类 型 为 Tf 的 元 
素 转 换 为 类 型 为 K 的 一 个 值 ， 这 个 值 表 示 分 组 值 ， 所 有 分 组 值 一 样 的 
元 素 会 被 归 为 同一 个 组 ， 放 到 一 个 列表 中 ， 所 以 返回 值 类 型 是 
Map<K，List<T>>。 比 如 ， 将 学 生 流 按照 年 级 进行 分 组 ， 代 码 为 : 


Map<String, List<Student>> groups = students.stream() 
.Collect(Collectors.groupingBy(Student::getGrade)); 


学 生 会 分 为 两 组 : 第 一 组 键 为 "1"， 分 组 学 生 包 
括 "zhangsan""wangwu" 和 "sunqi"; 第 二 组 键 为 "2"， 分 组 学 生 
括 "lisi""zhaoliu"。 这 段 代 码 基 本 等 同 于 如 下 代码 ; 


加 | 


Map<String, List<Student>> groups = new HashMap<>(); 
for(Student t : students) { 
String key = t.getGrade(); 
List<Student> container = groups.get(key); 
if(container == null) { 
container = new ArrayList<>(); 
groups.put(key, container); 


container.add(t); 


二 


显然 ， 使 用 groupingBy 要 人 简洁 清晰 得 多 ， 但 它 到 底 是 怎么 实现 的 
呢 ? 


2. 基 本 原理 
groupingBy 的 代码 为 : 


public static <T, K> Collector<T, ?, Map<K, List<T>>> 

groupingBy(Function<? super T, ? extends K> classifier) { 
return groupingBy(classifier, toList()); 

} 


它 调用 了 第 二 个 groupingBy 方 法 ， 传 递 了 toList 收 集 絮 ， 其 代码 


public static <T, K, A, D> Collector<T, ?, Map<K, D>> groupingBy( 
Function<? Super T, ? extends K> classifier, 
Collector<? super T, A, D> downstream) { 
return groupingBy(classifier, HashMap::new, downstream); 


} 


个 方法 接受 一 个 下 游 收 集 器 downstream 作 为 参数 ， 然 后 传递 给 
下 机 更 通 首 用 的 函数 : 


public static <T, K, D, A, M extends Map<K， D>> 
Collector<T, ?, M> groupingBy(Function<? super T, ? extends K> classifier, 
Supplier<M> mapFactory, Collector<? super T, A, D> downstream) 


classifieri 不 是 分 组 套 ， 工厂 二 ee 
HashMap: : new，downstream 表 示 下 游 收集 器 ， 下 游 收 集 絮 人 负责 收集 
同一 个 分 组 内 元 素 的 结果 。 


对 最 通用 的 groupingBy 范 数 返 回 的 收集 器 ， 其 收集 元 素 的 基本 过 
程 和 伪 代 码 为 : 


// 先 创建 一 个 存放 结果 的 Map 
Map map = mapFactory.get(); 
for(Tt : data) { 
// 对 每 一 个 元 素 ， 先 分 组 
K key = classifier. a 
// 找 存放 分 组 结果 的 容器 ， 如 果 让 下 游 收集 器 创建 ， 并 放 到 Map 中 


A container = map.get(key); 

if(container == null) { 
container = downstream,.supplier().get!(); 
map.put(key, container); 


} 
// 将 元 素 交 给 下 游 收 集 器 ( 即 分 组 收集 器 ) 收 集 


downstream.accumulator().accept(container, t); 


} 

// 调 用 分 组 收集 器 的 finisher 方 法 ， 转 换 结果 

for(Map.Entry entry : map.entrySet()) { 
entry.setValue(downstream.finisher().apply(entry.getVvalue())); 


return map; 


在 最 基本 的 groupingBy 范 数 中 ， 下 游 收 集 器 是 toList， 但 下 游 收 集 
铝 还 可 以 是 其 他 收集 器 ， 甚 至 是 groupingBy， 以 构成 多 级 分 组 。 下 面 
我 们 来 看 更 多 的 示例 。 


3. 分 组 计数 、 找 最 大 /最 小 元 素 
将 元 素 按 一 定 标准 分 为 多 组 ， 然 后 计算 每 组 的 个 数 ， 按 一 定 标准 


找 最 大 或 最 小 元 素 ， 这 是 一 个 常见 的 需求 。Collectors 提 供 了 一 些 对 应 
的 收集 器 ， 一 般 用 作 下 游 收集 器 ， 比 如 : 


// 计 数 

public static <T> Collector<T, ?, Long> counting() 

// 计 算 最 大 值 

public static <T> Collector<T, ?, Optional<T>> maxBy( 

Comparator<? super T> comparator) 

// 计 算 最 小 值 

public static <T> Collector<T, ?, Optional<T>> minBy( 
Comparator<? super T> comparator) 


还 有 更 为 通用 的 名 为 reducing 的 归 约 收集 右 ， 我 们 整 不 介绍 了 人 。 下 
面 看 一 些 例子 。 


为 了 便于 使 用 Collectors 中 的 方法 ， 我 们 将 其 中 的 方法 静态 导入 ， 
即 加 入 如 下 代码 : 


import static java.util.stream,.Collectors.*,; 


统计 每 个 年 级 的 学 生 个 数 ， 代 码 可 以 为 : 


Map<String, Long> gradeCountMap = students.stream().collect( 
groupingBy(Student::getGrade, counting())); 


统计 一 个 单词 流 中 每 个 单词 的 个 数 ， 按 出 现 顺 序 排序 ， 代 码 可 以 


Map<String, Long> wordCcountMap = 
Stream.of("hello", "world", "abc", "hello").collect( 
groupingBy(Function.identity(), LinkedHashMap: :new, counting())); 


获取 每 个 年 级 分 数 最 高 的 一 个 学 生 ， 代 码 可 以 为 : 


Map<String, Optional<Student>> topStudentMap = students.stream().collect( 
groupingBy(Student: :getGrade, 
maxBy(Comparator.comparing(Student::getSscore)))); 


需要 说 明 的 是 ， 这 个 分 组 收集 结果 是 Optional<Student>， 而 不 是 
Student， 这 是 因为 maxBy 处 理 的 流 可 能 是 空 流 ， 但 对 我 们 的 例子 ， 这 
是 不 可 能 的 。 为 了 直接 得 到 Student， 可 以 使 用 Collectors 的 另 一 个 收集 
右 collectingAndThen， 在 得 到 Optional<Student> 后 调用 Optional 的 get 方 
法 ， 如 下 所 示 : 


Map<String, Student> topStudentMap = students.stream().collect( 
groupingBy(Student::getGrade, collectingAndThen( 
maxBy(Comparator.comparing(Student::getScore)), Optional::get))); 


关于 collectingAndThen， 我 们 稍 后 再 进一步 讨论 。 
4. 分 组 数值 统计 
除了 基本 的 分 组 计数 ， 还 经 常 需要 进行 一 些 分 组 数值 统计 ， 比 如 


求学 生 分 数 的 和 、 平 均 分 、 最 高 分 、 最 低 分 等 、 针 对 int、long 和 
double 类 型 ，Collectors 提 供 了 专门 的 收集 器 ， 比 如 : 


// 求 平均 值 ，int 和 long 也 有 类 似 方法 

public static <T> Collector<T, ?, Double> 
averagingDouble(ToDoubleFunction<? super T> mapper) 

// 求 和 ，long 和 double 也 有 类 似 方法 

public static <T> Collector<T, ?, Integer> 


SummingInt(ToIntFunction<? Super T> mapper) 
// 求 多 种 汇总 信息 ，int 和 doub1e 也 有 类 似 方法 
//LongSummaryStatistics 包 括 个 数 、 最 大 值 、 最 小 值 、 和 、 平 均值 等 多 种 信息 
public static <T> Collector<T, ?, LongSummaryStatistics> 
summarizingLong(ToLongFunction<? super T> mapper) 


比如 ， 按 年 级 统计 学 生 分 数 信 息 ， 代 码 可 以 为 : 


Map<String, DoubleSummaryStatistics> gradeScoreStat = 
students.stream().collect(groupingBy(Student::getGrade, 
summarizingDouble(Student::getScore))); 


5. 分 组 内 的 map 


对 于 每 个 分 组 内 的 元 素 ， 我 们 感 兴 趣 的 可 能 不 是 元 素 本 映 ， 而 是 
它 的 某 部 分 信息 。 在 Stream API 中 ，Stream 有 map 方 法 ， 可 以 将 元 素 进 
行 转换 ，Collectors 也 为 分 组 元 素 提 供 了 函数 mapping， 如 下 所 示 : 


public static <T, U, A, R> 
Collector<T, ?, R> mapping(Function<? super T, ? extends U> mapper, 
Collector<? super U, A, R> downstream) 


交 给 下 游 收 集 絮 downstream 的 不 再 是 元 素 本 时， 而 是 应 用 转换 函 
数 mapper 之 后 的 结果 。 比 如 ， 对 学 生 按 年 级 分 组 ， 得 到 学 生 和 名称 列 
表 ， 代 码 可 以 为 : 


Map<String, List<String>> gradeNameMap = 
students.stream().collect(groupingBy(Student: :getGrade, 
mapping(Student::getName, toList()))); 
System,.out.println(gradeNameMap); 


AS y 
输出 为 : 
{1=[zhangsan, wangwu, sunqi], 2=[lisi, zhaoliu]} 


Stream 有 flatMap 方 法 。Java 9 为 Collectors 增 加 了 分 组 内 的 flatMap 
方法 flatMapping， 它 与 mapping 的 关系 如 同 Stream 中 fatMap 和 map 的 天 
分 、\， 这 里 就 不 举例 了 其 定义 为 : 


public static <T, U, A, R> Collector<T, ?, R> flatMapping( 
Function<? super T, ? extends Stream<? extends U>> mapper, 
Collector<? super U, A, R> downstream) 


6. 分 组 结果 人 处理 (filter/sort/skip/limit) 


对 分 组 后 的 元 素 ， 我 们 可 以 计数 ， 找 最 大 /最 小 元 素 ， 计 算 一 些 数 
值 特征 ， 还 可 以 转换 (map) 后 再 收集 ， 那 可 不 可 以 像 Stream API 一 
样 ， 排 序 (sort) 、 过 滤 (filter) 、 限 制 返回 元 素 (skipNimit) 呢 ? 
Collector 没 有 专门 的 收集 器 ， 但 有 一 个 通用 的 方法 : 


public static<T,A,R,RR> Collector<T,A,RR> collectingAndThen( 
Collector<T,A,R> downstream, Function<R,RR> finisher) 


这 个 方法 接受 一 个 下 游 收 集 器 downstream 和 一 个 finisher， 返 回 一 
众 
未 已 


个 收集 器 ， 它 的 主要 代码 为 : 


return new CollectorIimpl<>(downstream.supplier(), 
downstream.accumulator(),downstream.combiner(), 
downstream.finisher().andThen(finisher), characteristics); 


也 就 是 说 ， 它 在 下 游 收集 器 的 结果 上 又 调 用 了 finisher。 利 用 这 个 
finisher， 我 们 可 以 实现 多 种 功能 ， 下 面 看 一 些 例子 。 收 集 完 再 排序 ， 
可 以 定义 如 下 方法 : 


public static <T> Collector<T, ?, List<T>> collectingAndSort( 
Collector<T, ?, List<T>> downstream, Comparator<? super T> comparator) { 
return Collectors.collectingAndThen(downstream, (r) -> { 
r.sort(comparator); 
return r; 
}); 
} 


将 学 生 按 年 级 分 组 ， 分 组 内 的 学 生 按照 分 数 由 高 到 低 进 行 排序 ， 
利用 这 个 方法 ， 代 码 可 以 为 : 


Map<String, List<Student>> gradeStudentMap = students.stream() 
.Ccollect(groupingBy(Student::getGrade, collectingAndSsort(toList(), 
Comparator.comparing(Student::getSscore).reversed()))); 


针对 这 个 需求 ， 也 可 以 先 对 流 进 行 排 序 ， 然 后 再 分 组 。 
收集 完 再 过 滤 ， 可 以 定义 如 下 方法 : 


public static <T> Collector<T, ?, List<T>> collectingAndFilter( 
Collector<T, ?, List<T>> downstream, Predicate<T> predicate) { 
return Collectors.collectingAndThen(downstream, (r) -> 
return r.stream().filter(predicate).collect(Collectors.toList()); 


}); 


将 学 生 按 年 级 分 组 ， 分 组 后 ， 只 保留 不 及 格 的 学 生 〈 低 
于 60 分 ) ， 利 用 这 个 方法 ， 代 阳 可 以 为 和 


Map<String, List<Student>> gradeStudentMap = students.stream() 
.Collect(groupingBy(Student: :getGrade, 
collectingAndFilter(toList(), t->t.getSscore( )<60))); 


Java 9 中 ，Collectors 增 加 了 一 个 新 方法 ftering， 可 以 实现 相同 的 
功能 ， 定 义 为 : 


public static <T, A, R> Collector<T, ?, R> filtering( 
Predicate<? super T> predicate, Collector<? super T, A, R> downstream) 


用 法 如 下 : 


Map<String, List<Student>> gradeStudentMap = students.stream() 
.Collect(groupingBy(Student: :getGrade, 
filtering(t->t.getScore()<60, toList())); 


你 可 能 会 认为 ， 实 现 这 种 效果 也 可 以 和 完 对 整个 流 进行 过 滤 ， 
再 分 组 ， 比 如 这 样 : 


了 


Map<String, List<Student>> gradeStudentMap = students.stream() 
.filter(t->t.getScore( )<60) 
.collect(groupingBy(Student::getGrade, toList())); 


需要 说 明 的 是 ， 这 两 种 方式 的 结果 可 能 是 不 一 样 的， 如 采 是 多 过 
滤 ， 那 些 没 有 任何 元 素 的 分 组 就 不 会 出 现在 结 采 中 ， 而 如 果 是 先 分 
组 ， 即 使 该 组 内 的 元 素 都 被 过 滤 了 ， 组 也 会 出 现在 最 终结 有 果 中 ， 只 是 
分 组 结果 为 一 个 空 的 集合 。 


收集 完 ， 只 返回 特定 区 间 的 结果 ， 可 以 定义 如 下 方法 : 


public static <T> Collector<T, ?, List<T>> collectingAndSkipLimit( 
Collector<T, ?, List<T>> downstream, long skip, long limit) { 
return Collectors.collectingAndThen(downstream, (r) -> { 
return r.stream().skip(skip).1imit(1imit) 
.collect(Collectors.toList()); 
}); 
} 


比如 ， 将 学 生 按 年 级 分 组 ,分 组 后 ， 每 个 分 组 只 保留 前 两 名 的 学 
生 ， 代 码 可 以 为 : 


Map<String, List<Student>> gradeStudentMap = students.stream() 
.Sorted(Comparator.comparing(Student::getScore).reversed()) 
.Collect(groupingBy(Student::getGrade, 

collectingAndSkipLimit(toList(), 0, 2))); 


这 次 ， 我 们 先 对 学 生 流 进 行 了 排序 ， 然 后 再 进行 了 分 组 。 


mapping 和 collectingAndThen 都 接受 一 个 下 游 收 集 絮 ，mapping 在 
把 元 素 交 给 下 游 收集 器 之 前 先进 行 转换 ， 而 collectingAndThen 对 下 游 
收集 右 的 结果 进行 转换 ， 组 合 利 用 它们 ， 可 以 构造 更 为 灵活 强大 的 收 


集 器 。 


分 组 的 一 个 特殊 情况 是 分 区 ， 束 是 将 流 按 true/false 分 为 两 个 组 ， 
Collectors 有 专门 的 分 区 函数 : 


public static <T> Collector<T, ?, Map<Boolean, List<T>>> 
partitioningBy(Predicate<? super T> predicate) 

public static <T, D, A> Collector<T, ?, Map<Boolean, D>> 
partitioningBy(Predicate<? super T> predicate, 
Collector<? super T, A, D> downstream) 


第 一 个 函数 的 下 游 收 集 器 为 toList () ， 第 二 个 函数 可 以 指定 一 个 
下 游 收集 器 。 比 如 ， 将 学 生 按 照 是 否 及 格 (大 于 等 于 60 分 ) 分 为 两 
组 ， 代 码 可 以 为 : 


Map<Boolean, List<Student>> byPass = students.stream().collect( 
partitioningBy(t->t.getScore( )>=60)); 


按 是 否 及 格 分 组 后 ， 计 算 每 个 分 组 的 平均 分 ， 代 码 可 以 为 : 


Map<Boolean, Double> avgScoreMap = students.stream().collect( 
partitioningBy(t->t.getScore()>=60, averagingDouble(Student::getSscore))); 


8. 多 级 分 组 


groupingBy 和 partitioningBy 都 可 以 接受 一 个 下 游 收 集 器 ， 对 同一 
个 分 组 或 分 区 内 的 元 素 进 行进 一 步 收 集 ， 而 下 游 收集 絮 又 可 以 是 分 组 
或 分 区 ， 以 构建 多 级 分 组 。 比 如 ， 按 年 级 对 学 生 分 组 ， 分 组 后 ， 再 按 
照 是 否 及 格 对 学 生 进 行 分 区 ， 代 码 可 以 为 : 


Map<String, Map<Boolean, List<Student>>> multiGroup = students.stream() 
.Collect(groupingBy(Student::getGrade, 
partitioningBy(t->t.getScore( )>=60))); 


至 此 ， 关 于 函数 式 数据 处 理 Stream API 束 介绍 完了 ，Stream API 提 
供 了 集合 数据 处 理 的 第 用 函数 ， 利用 它们 ， 可 以 简洁 地 实现 大 部 分 常 
见 需 求 ， 大 大 减少 代码 ， 提 高 可 读 性 。 


26.4 组 合式 异步 编程 


前 面 两 节 讨 论 了 Java 8 中 的 函数 式 数 据 处 理 ， 那 是 对 容器 类 的 增 
强 ， 它 可 以 将 对 集合 数据 的 多 个 操作 以 流水 线 的 方式 组 合 在 一 起 。 本 
广 继 续 讨论 Java 8 的 新 功能 ， 主 要 是 一 个 新 的 类 CompletableFuture， 它 
是 对 并 发 编程 的 增强 ， 它 可 以 方便 地 将 多 个 有 一 定 依赖 天 系 的 异步 任 
务 以 流水 线 的 方式 组 合 在 一 起 ， 大 大 简化 多 异步 任务 的 开发 。 


之 前 介绍 了 那么 多 并 发 编程 的 内 容 ， 还 有 什么 问题 不 能 解决 ? 
CompletableFuture 到 撒 能 解决 什么 问题 ? 与 之 前 介绍 的 内 容 有 什么 天 
系 ? 具体 如 何 使 用 ? 基本 原理 是 什么 ?本 市 进行 详细 讨论 ， 我 们 先 来 
看 它 要 解决 的 问题 。 


264.1 异 此 任务 官 理 


在 现代 软件 开发 中 ， 系 统 功能 越 来 越 复杂 ， 管 理 复杂 度 的 方法 束 
征 分 而 治之 ， 系 统 的 很 多 功能 可 能 会 被 切 分 为 小 的 服务 ， 对 外 提供 
Web API， 单 独 开发 、 部 署 和 维护 。 比 如 ， 在 一 个 电 商 系统 中 ， 可 能 
有 专门 的 产品 服务 、 订 单 服务 、 用 户 服务 、 推 荐 服务 、 优 惠 服 务 、 搜 
索 服务 等 ， 在 对 外 具体 展示 一 个 页 面 时 ， 可 能 要 调用 多 个 服务 ， 而 多 
个 调用 之 间 可 能 还 有 一 定 的 依赖 。 比 如 ， 显 示 一 个 产品 页 面 ， 和 需要 调 
用 产品 服务 ， 也 可 能 需要 调用 推荐 服务 获取 与 该 产品 有 关 的 其 他 推 
存 ， 还 可 能 需要 调用 优惠 服务 获取 该 产品 相关 的 促销 优惠 ， 而 为 了 调 
用 优惠 服务 ， 可 能 需要 先 调用 用 户 服务 以 获取 用 户 的 会 员 级 别 。 


另外 ， 现 代 软 件 经 常 依赖 很 多 第 三 方 服务 ， 比 如 地 图 服务 、 短 信 
服务 、 天 气 服务 、 汇 率 服务 等 ， 在 实现 一 个 具体 功能 时 ， 可 能 要 访问 
多 个 这 样 的 服务 ， 这 些 访问 之 间 可 能 存在 着 一 定 的 依赖 关系。 


为 了 提高 性 能 ， 充 分 利用 系统 资源 ， 这 些 对 外 部 服务 的 调用 一 般 
都 应 该 是 异步 的 、 尽 量 并 发 的 。 我 们 之 前 介绍 过 异步 任务 执行 服务 ， 
使 用 ExecutorService 可 以 方便 地 提交 单个 独立 的 异步 任务 ， 可 以 方便 
地 在 需要 的 时 候 通 过 Future 接 口 获取 异步 任务 的 结果 ， 但 对 于 多 个 尤 
其 是 有 一 定 依赖 关系 的 异步 任务 ， 这 种 文 持 就 不 够 了 。 


于 是 ， 就 有 了 CompletableFuture， 它 是 一 个 具体 的 类 ， 实 现 了 两 
个 接口 ， 一 个 是 Future， 男 一 个 是 CompletionStage。Future 表 示 异 步 任 
务 的 结果 ， 而 CompletionStage 的 字面 意思 是 完成 阶段 。 多 个 
CompletionStage 可 以 以 流水 线 的 方式 组 合 起 来 ， 对 于 其 中 一 个 
CompletionStage， 它 有 一 个 计算 任务 ， 但 可 能 需要 等 竺 其 他 一 个 或 多 
个 阶段 完成 才能 开始 ， 它 完成 后 ， 可 能 会 触发 其 他 阶段 开始 运行 。 
CompletionStage 提 供 了 大 量 方法 ， 使 用 它们 ， 可 以 方便 地 啊 应 任务 事 
件 ， 构 建 任 务 流水 线 ， 实 现 组 合式 异步 编程 。 


具体 怎么 使 用 呢 ? 下 面 我 们 会 逐步 说 明 ，CompletableFuture 也 是 
一 个 Future， 我 们 先 来 看 与 Future 类 似 的 地 方 。 


26.4.2 ”与 Future/FutureTask 对 比 


我 们 先 通 过 示例 来 简要 回顾 下 异步 任务 执行 服务 和 Future 。 
1. 基 本 的 任务 执行 服务 


竺 异步 任务 执行 服务 中 ， 用 Callable 或 Runnable 表 示 任 务 。 以 
Callable 为 例 ， 一 个 模拟 的 外 部 任务 为 : 


private static Random rnd = new Random( ) ， 
static int delayRandom(int min, int max) { 
int milli = max > min ? rnd.nextInt(max - min) : 09; 
try { 
Thread ,Sleep(min + milli); 
} catch (InterruptedException e) { 


} 
return milli,; 
} 
static Callable<Integer> externalTask = () -> { 
int time = delayRandom(20, 2000); 
return time; 
}; 
externalTask 表 示 外 部 任务 ， 我 们 使 用 了 Lambda 表 达 式 ， 
delayRandom 用 于 模拟 延 时 。 


假定 有 一 个 异步 任务 执行 服务 ， 其 代码 为 : 


private static ExecutorService executor = 
Executors.newFixedThreadPool1(10); 


通过 任务 执行 服务 调用 外 部 服务 ， 一 般 返 回 Future， 表 示 异 步 结 
果 ， 示 例 代码 为 : 


public static Future<Integer> callExternalService(){ 
return executor.submit(externalTask); 


在 主 程序 中 ， 异步 任务 和 本 地 调用 的 示例 代码 为 : 


public static void master() { 
// 执 行 异步 任务 
Future<Integer> asyncRet = callExternalService(); 


// 执 行 其 他 任务 …. 
// 获 取 异 步 任 务 的 结果 ， 处 理 可 能 的 异常 
try { 


Integer ret = asyncRet .get(); 
System.out.println(ret); 

} catch (InterruptedException e) { 
e.printSstackTrace( ); 

} catch (ExecutionException e) { 
e.printStackTrace( ); 


2. 基 本 的 CompletableFuture 


使 用 CompletableFuture 可 以 实现 类 似 功能 ， 不 过 ， 它 不 支持 使 用 
Callable 表 示 异 步 任务 ， 而 支持 Runnable 和 Supplier。Supplier 蔡 代 
Callable 表 示 有 返回 结果 的 异步 任务 ， 与 Callable 的 区 别 是 ， 它 不 能 抛 
出 受 检 异常 ， 如 果 会 发 生 异 常 ， 可 以 扫 出 运行 时 异常 。 


使 用 Supplier 表 示 异 步 任 务 ， 代 码 与 Callable 类 似 ， 蔡 换 变 量 类 型 
即 可 : 


static Supplier<Integer> externalTask = () -> { 
int time = delayRandom(20, 2000); 
return time; 


}; 


使 用 CompletableFuture 调 用 外 部 服务 的 代码 可 以 为 : 


public static Future<Integer> callExternalService(){ 
return CompletableFuture.supplyAsync(externalTask, executor); 


} 
supplyAsync 是 一 个 静态 方法 ， 其 定义 为 : 


public static <U> CompletableFuture<U> supplyAsync( 
Supplier<U> supplier, Executor executor) 


它 接受 两 个 参数 supplier 和 executor， 使 用 executor 执 行 supplier 表 示 
的 任务 ， 返 回 一 个 CompletableFuture， 调 用 后 ， 任 务 被 异步 执行 ， 这 
个 方法 立即 返回 。 


supplyAsync 还 有 一 个 不 带 executor 参 数 的 方法 : 


public static <U> CompletableFuture<U> supplyAsync(Supplier<U> supplier) 


没有 executor， 任 务 被 谁 执行 呢 ? 与 系统 环境 和 配置 有 关 ， 一 般 来 
说 ， 如 果 可 用 的 CPU 核 数 大 于 2， 会 使 用 Java 7 引入 的 ForkJoin 任 务 执 
行 服务 ， 即 ForkJoinPool.common-Pool () ， 该 任务 执行 服务 背后 的 工 
作 线 程 数 一 般 为 CPU 核 数 减 1， 即 Runtime.getRuntime 

() .availableProcessors () -1， 和 否则 ， 会 使 用 
ThreadPerTaskExecutor， 它 会 为 每 个 任务 创建 一 个 线程 。 


对 于 CPU 密 集 型 的 运算 任务 ， 使 用 Fork/Join 任 务 执行 服务 是 合 
的 ， 但 对 于 一 般 的 调用 外 部 服务 的 异步 任务 ，Fork/Join 可 能 是 不 合 
的 ， 因 为 它 的 并 行 度 比较 低 ， 可 能 会 让 本 可 以 并 发 的 多 任务 串 行 运 
行 ， 这 时 ， 应 该 提供 Executor 人 参数 。 

后 面 我 们 还 会 看 到 很 多 以 Async 结 尾 命名 的 方法 ， 一 般 都 有 两 个 
版 本 ， 一 个 带 Executor 参 数 ， 男 一 个 不 带 ， 其 含义 是 相同 的 ， 束 不 再 
重复 介绍 了 。 


对 于 类 型 为 Runnable 的 任务 ， 构 建 CompletableFuture 的 方法 为 : 


站 
适 


public static CompletableFuture<Void> runAsync( 
Runnable runnable) 

public static CompletableFuture<Void> runAsync( 
Runnable runnable, Executor executor) 


它 己 supplyAsync 是 类 似 的 ， 具 体 束 不 帝 述 了 
3.CompletableFuture 对 Future 的 基本 增强 


Future 有 的 接口 ，CompletableFuture 都 是 支持 的 ， 不 过 
CompletableFuture 还 有 一 些 额 外 的 相关 方法 ， 比 如 : 


public T join() 
public boolean isCompletedExceptionally() 
public T getNow(T valueIfAbsent ) 


join 与 get 方 法 类 似 ， 也 会 等 竺 任务 结束 ， 但 EA 抛 出 受 检 异 
常 。 如 有 果 任 务 异常 结束 了 ， jaim 全 将 异常 包装 为 运行 时 异常 
CompletionFException 抛 出 。 


Future 有 isDone 方 法 检查 任务 是 否 结束 了， 但 不 知道 任务 是 正常 结 
束 还 是 异常 结束 ，isCompletedExceptionally 方 法 可 以 判断 任务 是 否 是 
异常 结 束 。 


getNow 守 join 类 似 ， 区 别 是 ， 如 果 任 务 还 没有 结束 ，getNow 不 会 
等 待 ， 而 是 会 返回 传 入 的 参数 valueIfAbsent 。 


一 步 理解 Future/CompletableFuture 

前 面 例子 都 使 用 了 任务 执行 服务 ， 其 实 ， 任 务 执行 服务 与 异步 结 
果 Future 不 是 绑 在 一 起 的 ， 可 以 自己 创建 线程 返回 异步 结果 。 为 进 一 
步 理解 ， 我 们 看 些 示 例 。 


使 用 FutureTask 调 用 外 部 服务 ， 代 码 可 以 为 : 


public static Future<Integer> callExternalService() { 
FutureTask<Integer> future = new FutureTask<>(externalTask); 
new Thread() { 
public void run() { 
future.run(); 


}.start(); 
return future; 


} 


内 部 目 己 创建 了 一 个 线程 ， 线 程 调用 FutureTask 的 run 方 法 。 我 们 
之 前 分 析 过 Future- a 代 . run 方 法 会 调用 externalTask 的 call 方 
法 ， 并 保存 结果 或 肆 到 的 异常 ， 唤 醒 等 待 结果 的 线程 。 


使 用 CompletableFuture， 也 可 以 直接 创建 线程 ， 并 返回 异步 结 
果 ， 代 码 可 以 为 : 


public static Future<Integer> callExternalService() { 
CompletableFuture<Integer> future = new CompletableFuture<>(); 
new Thread() { 
public void run() { 
try { 
future.complete(externalTask.get()); 
} catch (Exception e) { 
future.completeExceptionally(e); 
} 


} 
}.start(); 
return future; 


} 


这 里 使 用 了 CompletableFuture 的 两 个 方法 : 


public boolean complete(T value) 
public boolean completeExceptionally(Throwable ex) 


这 两 个 方法 显 式 设置 任务 的 状态 和 结果 ， es 
完成 ， 结 果 为 value，completeExceptionally 设 置 任务 异常 结束 ， 党 为 
ex。Future 接 口 没 有 对 应 的 方法 ，Future-Task 有 相关 方法 但 不 < 是 Dublic 
的 (是 protected 的 ) 。 设 置 完 后 ， 它 们 都 会 触发 其 他 依赖 它们 的 
CompletionStage。 具 体会 触发 什么 呢 ? 我 们 接 下 来 再 看 。 


26.4.3 ”了 啊 应 结果 或 异常 


ns 我 们 只 能 通过 get 获 取 结 果 ， 而 get 可 能 会 需要 阻塞 等 
每 ， 而 通过 Com-pletionStage， 可 以 注册 回调 函数 ， 当 任务 完成 或 如 党 


结束 时 目 动 触发 执行 。 有 两 类 注册 方法 : whenComplete 和 handle， 我 


们 分 别 介绍 。 
1.whenComplete 


whenComplete 的 声明 为 : 


public CompletableFuture<T> whenComplete( 
BiConsumer<? super T, ? super Throwable> action) 


参数 action 表 示 回 调 函 数 ， 不 管 前 一 个 阶段 是 正常 结束 还 是 异常 结 
束 ， 它 都 会 被 调用 ， 男 数 类 型 是 BiConsumer， 接 受 两 个 参数 ， 人 第 一 个 
参数 是 正常 结束 时 的 结果 值 ， 第 二 个 参数 是 异常 结束 时 的 异常 ， 
BiConsumer 没 有 返回 值 。whenComplete 的 返回 值 还 是 
CompletableFuture， 它 不 会 改变 原 阶 段 的 结果 ， 还 可 以 在 其 上 继续 调 
用 其 他 函数 。 看 个 简单 的 示例 : 


CompletableFuture.supplyAsync(externalTask).whenCcomplete((result, ex) -> { 
if(result != null) 
System.out.printljn(result); 


} 
if(ex != null 
ex.printSstackTrace(); 


}).join(); 


result 表 示 前 一 个 阶段 的 结果 ，ex 表 示 异 常 ， 只 可 能 有 一 个 不 为 
null ° 


whenComplete 注 册 的 函数 具体 由 谁 执行 呢 ? 一 般 而 言 ， 这 要 看 注 
册 时 任务 的 状态 。 如 果 注 册 时 任务 还 没有 结束 ， 则 注册 的 函数 会 由 执 
行 任务 的 线程 执行 ， 在 该 线程 执行 完 任 务 后 执行 注册 的 函数 ， 如 果 注 
册 时 任务 已 经 结束 了 ， 则 由 当前 线程 〈“ 即 调用 注册 函数 的 线程 ) 执 
行 。 


如 采 不 布 望 当前 线程 执行 ， 避 人 免 可 能 的 同步 阻塞 ， 可 以 使 用 其 他 
两 个 异步 注册 方法 : 


public CompletableFuture<T> whenCompleteAsync( 
BiConsumer<? super T, ? super Throwable> action) 
public CompletableFuture<T> whenCompleteAsync( 
BiConsumer<? super T, ? super Throwable> action, Executor executor) 


与 前 面 介 绍 的 以 Async 结 尾 的 方法 一 样 ， 对 第 一 个 方法 ， 注 册 画 
数 action 会 由 默认 的 任务 执行 服务 ( 即 ForkJoinPool.commonPool () 或 
ThreadPerTaskExecutor) 执行 ， 对 第 二 个 方法 ， 会 由 参数 中 指定 的 
executor 执 行 


2.handle 


whenComplete 只 是 注册 回调 函数 ， 不 改变 结果 ， 它 返回 了 一 个 
CompletableFuture， 但 这 个 CompletableFuture 的 结果 与 调用 它 的 
CompletableFuture 是 一 样 的 ， 还 有 一 个 类 似 的 注册 方法 handle， 其 声明 
为 : 


public <U> CompletableFuture<U> handle( 
BiFunction<? super T, Throwable, ? extends U> fn) 


回调 函数 是 一 个 BiFunction， 也 是 接受 两 个 参数 ， 一 个 是 正常 结 
果 ， 另 一 个 是 异 彰 ， 但 BiFunction 有 返回 值 ， 在 handle 返 回 的 
CompletableFuture 中 ， 结 果 会 被 BiFunction 的 返回 值 蔡 代 ， 即 使 原来 有 
异常 ， 也 会 被 覆盖 ， 比 如 : 


String ret = 
CompletableFuture.supplyAsync(()->{ 
throw new RuntimeException("test"),; 
}).handle((result, ex)->{ 
return "hello"; 
}).join(); 
System.out.println(ret); 


输出 为 "hello"。 有 异步 任务 抛 出 了 腊 遂 ， 但 通过 handle 方 法 ， 改 变 了 
人 


与 whenComplete 类 似 ，handle 也 有 对 应 的 异步 注册 方法 
handleAsync， 上 有 具体 我 们 残 不 探讨 了 。 


3.exceptionally 


whenComplete 和 handle 都 是 既 啊 应 正常 完成 也 响应 异常 ， 如 有 果 只 
对 异常 感 兴趣 ， 可 以 使 用 exceptionally， 其 声明 为 : 


public CompletableFuture<T> exceptionally( 
Function<Throwable, ? extends T> fn) 


它 注册 的 回调 函数 是 Function， 接 受 的 参数 为 异常 ， 返 回 一 个 
值 ， 与 handle 类 似 ， 它 也 会 改变 结果 ， 具 体 束 不 举例 了 。 


除了 啊 应 结果 和 异常 ， 使 用 CompletableFuture， 可 以 方便 地 构建 
有 多 种 依赖 关系 的 任务 流 ， 我 们 先 来 看 简单 的 依赖 单一 阶段 的 情况 。 


26.4.4 构建 依赖 单一 阶段 的 任务 流 


我 们 来 看 几 个 相关 的 方法 


thenCompose ° 


thenRun 、thenAccept/thenApply 和 


1.thenRun 
在 一 个 阶段 正常 完成 后 ， 执 行 下 一 个 任务 ， 看 个 简单 示例 : 


Runnable taskA () -> System.out.printin("task A"); 
Runnable taskB () -> System,.out.println("task B"); 
Runnable taskC = () -> System.out.println("task C"); 
CompletableFuture.runAsync(taskA).thenRun(taskB).thenRun(taskC).join(); 


这 里 ， 有 三 个 异步 任务 taskA、taskB 和 和 taskC， 通过 thenRun 自然 地 
描述 了 它们 的 依赖 关系 。thenRun 是 同步 版 本 ， 有 对 应 的 异步 版 本 
thenRunAsync: 


public CompletableFuture<Void> thenRunAsync(Runnable action) 
public CompletableFuture<Void> thenRunAsync(Runnable action, 
Executor executor) 


在 thenRun 构 建 的 任务 流 中 ， 只 有 前 一 个 阶段 没有 有 异 肖 结束 ， 下 一 
个 阶段 的 任务 才 会 执行 ， 如 有 果 前 一 个 阶段 发 生 了 异常 ， 所 有 后 续 阶 段 


都 不 会 运行 ， 绪 末 会 被 设 为 相同 的 异 音 ， 调 用 join 会 抛 出 运行 时 异 各 
CompletionEXception。 


thenRun 指 定 的 下 一 个 任务 类 型 是 Runnable， 它 不 需要 前 一 个 阶段 
的 结果 作为 参数 ， 也 没有 返回 值 ， 所 以 ， 在 thenRun 返 回 的 
CompletableFuture 中 ， 结 采 类 型 为 Void， 即 没有 结 


2.thenAccept/thenApply 


如 果 下 一 个 任务 需要 前 一 个 阶段 的 结果 作为 参数 ， 可 以 使 用 
thenAccept 或 thenApply 方 法 : 


public CompletableFuture<Void> thenAccept( 
Consumer<? super T> action) 

public <U> CompletableFuture<U> thenApply( 
Function<? super T,? extends U> fn) 


thenAccept 的 任务 类 型 是 Consumer， 它 接受 前 一 个 阶段 的 结果 作 
为 参数 ， 没 有 返回 值 。thenApply 的 任务 类 型 是 Function， 接 受 前 一 个 
阶段 的 结果 作为 参数 ， 返 回 一 个 新 的 值 ， 这 个 值 会 成 为 thenApply 返 回 
的 CompletableFuture 的 结果 值 。 看 个 简单 示例 : 


Supplier<String> taskA = () -> "hello"; 

Function<String, String> taskB = (t) -> t.toUpperCase( )， 

Consumer<String> taskC = (t) -> System,out.printJln("consume: " + t); 

CompletableFuture. supplyAsync( taskA) 
.thenApply(taskB).thenAccept(taskC).join(); 


taskA 的 结果 是 "hello"， 传 递 给 了 taskB，taskB 转 换 结 果 
为 "HELLO"， 再 把 结果 给 taskC，taskC 进 行 了 和 输出 ， 所 以 输出 为 : 


consume: HELLO 


CompletableFuture 中 有 很 多 名 称 带 有 run、accept 或 apply 的 方法 ， 
它们 一 般 与 任务 的 类 型 相对 应 ，run 与 Runnable 对 应 ，accept 与 
Consumer 对 应，apply 与 Function 对 上 应， 后续 就 不 性 述 了 。 


3.thenCompose 


与 thenApply 类 似 ， 还 有 一 个 方法 thenCompose， 声 明 为 : 


public <U> CompletableFuture<U> thenCompose( 
Function<? Super T, ? extends CompJletionStage<U>> fn) 


这 个 任务 类 型 也 是 Function， 也 是 接受 前 一 个 阶段 的 结果 ， 返 回 
一 个 新 的 结果 。 不 过 ， 这 个 转换 函数 徊 的 返回 值 类 型 古 
CompletionStage， 也 就 是 说 ， 它 的 返回 值 也 是 一 个 阶段 ， 如 有 果 使 用 
thenApply， 结 果 就 会 变 为 
CompletableFuture<CompletableFuture<U>>， 而 使 用 thenCompose， 会 
直接 返回 返回 的 CompletionStage。thenCompose 与 thenApply 的 区 别 束 
如 同 Stream API 中 flatMap 与 map 的 区 别 ， 看 个 简单 的 示例 : 


Supplier<String> taskA = () -> "hello"; 
Function<String, CompletableFuture<String>> taskB = (t) -> 
CompletableFuture.supplyAsync(() -> t.toUpperCase( ) )， 
Consumer<String> taskC = (t) -> System,out.printJln("consume: " + t); 
CompletableFuture. supplyAsync( taskA) 
‘thenCcompose(taskB).thenAccept(taskCc).join(); 


以 上 代码 中 ，taskB 是 一 个 转换 函数 ， 但 它 目 己 也 执行 了 异步 任 
务 ， 返 回 类 型 也 是 CompletableFuture， 所 以 使 用 了 thenCompose。 


26.4.5 ”构建 依赖 两 个 阶段 的 任务 流 


thenRun、thenAccept、thenApply 和 thenCompose 用 于 在 一 个 阶段 
完成 后 ed ，CompletableFuture 还 有 一 些 方法 用 于 在 两 个 
阶段 都 完成 后 执行 为 一 个 任务 ， 方 法 是 : 


public CompletableFuture<Void> runAfterBoth( 
CompletionStage<?> other, Runnable action 

public <U,V> CompletableFuture<V> thenCombine( 
CompletionStage<? extends U> other, 
BiFunction<? super T,? Super U,? extends V> fn) 

public <U> CompletableFuture<Void> thenAcceptBoth( 
CompletionStage<? extends U> other, 
BiConsumer<? super T, ? super U> action) 


runAfterBoth 对 应 的 任务 类 型 是 Runnable，thenCombine 对 应 的 任 
务 类 型 是 BiFunction， 接 受 前 两 个 阶段 的 结 采 作为 参数 ， 返 回 一 个 结 
果 ; thenAcceptBoth 对 应 的 任务 类 型 是 BiConsumer， 接 受 前 两 个 阶段 
的 结果 作为 参数 ， 但 不 返回 结果 。 它 们 都 有 对 应 的 异步 和 融 Executor 
参数 的 版 本 ， 用 于 指定 下 一 个 任务 由 谁 执行 ， 具 体 残 不敬 述 了 。 当 前 
阶段 和 参数 指定 的 另 一 个 阶段 other 没有 依赖 和 关系， 并 发 执行 ， 当 两 个 
都 执行 结束 后 ， 开 始 执行 指定 的 另 一 个 任务 。 


看 个 简单 的 示例 ， 任 务 A 和 执行 结 来 后， 执行 任务 C 合 并 结果 


Supplier<String> taskA = () -> "taskA"; 
CompletableFuture<String> taskB = CompletableFuture.supplyAsync( 
() -> "taskB"),; 
BiFunction<String, String, String> taskC = (a, b) ->a+","+b; 
String ret = CompletableFuture.supplyAsync(taskA) 
‘thenCcombineAsync(taskB, taskcC).join(); 
System.out.println(ret); 


输出 为 : 
taskA, taskB 


前 面 的 方法 要 求 两 个 阶段 都 完成 后 才 执行 下 一 个 任务 ， 如 果 只 需 
要 其 中 任意 一 个 阶段 完成 ， 可 以 使 用 下 面 的 方法 : 


public CompletableFuture<Void> runAfterEither( 

CompletionStage<?> other, Runnable action) 
public <U> CompletableFuture<U> applyToEither( 

CompletionStage<? extends T> other, Function<? super T, U> fn) 
public CompletableFuture<Void> acceptEither( 

CompletionStage<? extends T> other, Consumer<? super T> action) 


它们 都 有 对 应 的 异步 和 带 Executor 参 数 的 版 本 ， 用 于 指定 下 一 个 
任务 由 谁 执行 ， 具 体 束 不 次 述 了 。 当 前 阶段 和 参数 指定 的 即 一 个 阶段 
other 没 有 依赖 关系 ， 并 发 执行 ， 只 要 其 中 一 个 执行 完了 ， 束 会 局 动 参 
数 指定 的 另 一 个 任务 ， 具 体 就 不 痪 述 了 。 


26.4.6 ”构建 依赖 多 个 阶段 的 任务 流 


如 果 依 赖 的 阶段 不 止 两 个 ， 可 以 使 用 如 下 方法 : 


public static CompletableFuture<Void> allof (CompletableFuture<?>... cfs) 
public static CompletableFuture<Object> anyOof (CompletableFuture<?>... cfs) 


它们 是 静态 方法 ， 基 于 多 个 CompletableFuture 构 建 了 一 个 新 的 
CompletableFuture ° 


对 于 allOf， 当 所 有 子 CompletableFuture 都 完成 时 ， 它 才 完 成 ， 如 
果 有 的 Completable-Future 异 常 结束 了 ， 则 新 的 CompletableFuture 的 结 
果 也 是 异常 。 不 过 ， 它 并 不 会 因为 有 异常 就 提前 结束 ， 而 是 会 等 得 所 
有 阶段 结束 ， 如 果 有 多 个 阶段 异常 结束 ， 新 的 Com-pletableFuture 中 保 
存 的 异常 是 最 后 一 个 的 。 新 的 CompletableFuture 会 持 有 异常 结果 ， 但 

` 会 你 存 正常 结束 的 结果 ， 如 采 需 要 ， 可 以 从 每 个 阶段 中 获取 。 看 个 
简单 的 示例 : 


CompletableFuture<String> taskA = CompletableFuture.supplyAsync(() -> { 
delayRandom(100, 1000); 
return "helloA"; 

}, executor); 

CompletableFuture<Void> taskB = CompletableFuture.runAsync(() -> { 
delayRandom(2000, 3000); 

}, executor); 

CompletableFuture<Void> taskC = CompletableFuture.runAsync(() -> { 
delayRandom(30, 100); 
throw new RuntimeException("task C exception"); 

}, executor); 

CompletableFuture.allof (taskA, taskB, taskC).whenCcomplete((result, ex) -> { 
if(ex != null) { 

System.out.println(ex.getMessage( )); 


} 
if(!taskA.isCompletedExceptionally()) { 
System.out.println("task A " + taskA.join()); 


}); 


taskC 会 首先 异常 结束 ， 但 新 构建 的 CompletableFuture 会 等 得 其 他 
两 个 阶段 结束 ， 都 结束 后 ， 可 以 通过 子 阶段 (如 taskA) 的 方法 检查 子 
阶段 的 状态 和 结 


对 于 anyOf 返 回 的 CompletableFuture， 当 第 一 个 子 
CompletableFuture 完 成 或 异常 结束 时 ， 它 相应 地 完成 或 异常 结束 ， 结 
果 与 第 一 个 结束 的 子 CompletableFuture 一 样 ， 具 体 就 不 举例 了 。 


26.47 小 结 


本 节 介 绍 了 Java 8 中 的 组 合式 异步 编程 CompletableFuture: 


1) 它 是 对 Future 的 增强 ， 但 可 以 啊 应 结果 或 异常 事件 ， 有 很 多 方 
法 构建 异步 任务 流 。 


2) 根据 任务 由 谁 执行 ， 一 般 有 三 类 对 应 方法 : 名 称 不 带 Async 的 
方法 由 当前 线程 或 前 一 个 阶段 的 线程 执行 ， 训 Async 但 没有 指定 
Executor 的 方法 由 默认 Excecutor (Fork-JoinPool.commonPool () 或 
ThreadPerTaskExecutor) 执行 ， 带 Async 且 指定 Executor 参 数 的 方法 由 
指定 的 Executor 执 行 。 


3) 根据 任务 类 型 ， 一 般 也 有 三 类 对 应 方法 : 名 称 带 run 的 对 应 
Runnable， 带 accept 的 对 应 Consumer， 带 apply 的 对 应 Function 。 


使 用 CompletableFuture， 可 以 简洁 目 然 地 表达 多 个 异步 任务 之 间 
的 依赖 天 系 和 执行 流程 ， 大 大 简化 代码 ， 提 高 可 读 性 。 


26.5 _ Java 8 的 日 期 和 时 间 API 


本 贡 介 绍 Java 8 对 日 期 和 时 间 API 的 增强 。 我 们 在 之 前 介绍 了 Java 
8 以 前 的 日 期 和 时 间 AP 主要 的 类 是 Date 和 Calendar， 由 于 它 的 设计 
有 一 些 不 足 ，Java 8 引入 了 一 套 新 的 API， 位 于 包 java.time 下 。 本 厄 我 
们 天 来 简要 介绍 这 套 新 的 API， 先 从 日 期 和 时 间 的 表示 开始 。 


26.5.1 ”表示 日 期 和 时 间 


我 们 在 第 7 章 介绍 过 日 期 和 时 间 的 几 个 基本 概念 ， Cl 时 区 
.9 这 里 就 不 交 述 了 。Java 8 中 表示 日 期 和 时 间 的 类 有 多 个 ， 主 要 


-Instant: 表示 时 刻 ， 不 直接 对 应 年 月 日 信息 ， 需 要 通过 时 区 转 


.LocalDateTime: 表示 与 时 区 无 关 的 日 期 和 时 间 ， 不 直接 对 应 时 
刻 ， 需 要 通过 时 区 转换 


:Zoneld/ZoneOffset 表示 时 区 ; 


.LocalDate: 表示 与 时 区 无 关 的 日 期 ， 与 LocalDateTime 相 比 ， 只 
有 日 期 ， 没 有 时 间 信 息 ; 


.LocalTime: 表示 与 时 区 无 关 的 时 间 ， 与 LocalDateTime 相 比 ， 只 
有 时间， 没有 日 期 信息 .; 


.ZonedDateTime: 表示 特定 时 区 的 日 期 和 时 间 。 
类 比较 多 ， 但 概念 更 为 清 蜥 了， 下 面 我 们 逐个 介 


1.Instant 


Instant 表 示 时 刻 ， 获 取 当 前 时 刻 ， 代 码 为 


Instant now = Instant.now(); 


可 以 根据 Epoch Time (纪元 时 ) 创建 Instant。 比 如 ， 男 一 种 获取 
当前 时 刻 的 代码 可 以 为 : 


Instant now = Instant.ofEpochMilli(System.currentTimeMillis()); 


我 们 知道 ，Date 也 表示 时 刻 ，Instant 和 Date 可 以 通过 纪元 时 相互 转 
换 ， 比 如 ， 转 换 Date 为 Instant， 代 三 为 : 


public static Instant toInstant(Date date) { 
return Instant.ofEpochMilli(date.getTime( )); 
} 


转换 Instant 为 Date， 代 码 为 : 


public static Date toDate(Instant instant) { 
return new Date(instant.toEpochMil1i()); 


Instant 有 很 多 基于 时 刻 的 比较 和 计算 方法 ， 大 多 比较 直观 ， 我 们 
就 不 列举 了 。 


2.LocalDateTime 


LocalDateTime 表 示 与 时 区 无 天 的 日 期 和 时 间 ， 获 取 系统 默 认 时 区 
的 当前 日 期 和 时 间 ， 代 码 为 : 


LocalDateTime ldt = LocalDateTime,.now( ) ; 


还 可 以 直接 用 年 月 日 等 信息 构建 LocalDateTime。 上 比如， 表示 2017 
年 7 月 11 日 20 点 45 分 5 秒 ， 代 码 可 以 为 : 


LocalDateTime ldt = LocalDateTime.of(2017, 7, 11, 20, 45, 5); 


LocalDateTime 有 很 多 方法 ， 可 以 获取 年 月 日 时 分 秒 等 日 历 信 息 ， 


比如 : 


public 
public 
public 
public 
public 
public 


int 
int 
int 
int 
int 
int 


getYear() 
getMonthvalue() 
getDayofMonth() 
getHour() 
getMinute() 
getSecond() 


还 可 以 获取 星期 几 等 信息 ， 比 如 : 


public DayOfweek getDayofweek() 


DayOfWeek 是 一 个 枚 举 ， 有 7 个 取 值 ， 从 DayOfWeek.MONDAY 到 | 
DayOfWeek.SUN-DAY ° 


3.Zoneld/ZoneOffset 


LocalDateTime 不 能 直接 转 为 时 刻 Instant， 转 换 需 要 一 个 参数 
ZoneOffset，ZoneOffset 表 示 相 对 于 格林 尼 治 的 时 区 差 ， 北 京 是 +08: 
00。 比 如， 转换 一 个 LocalDateTime 为 北京 的 上 时刻， 方法 为 : 


public static Instant toBeijingInstant(LocalDateTime ldt) { 
return ldt.toInstant(Zoneoffset.of("+08:00")); 


给 定 一 个 时 刻 ， 使 用 不 同时 区 解读 ， 日 历 信 息 是 不 同 的 ，Instant 


有 方法 根据 时 区 返回 一 个 ZonedDateTime: 


public ZonedDateTime atZzone(ZoneId zone ) 


默认 时 区 是 ZoneId.systemDefault () ， 可 以 这 样 构建 Zoneld: 


// 北 京 时 


区 


ZoneId bjzone = ZoneId.of("GMT+08:00") 


ZoneOtffset 是 ZoneId 的 子 类 ， 可 以 根据 时 区 差 构造 。 
4.LocalDate/LocalTime 


可 以 认为 LocalDateTime 由 两 部 分 组 成 ， 一 部 分 是 日 期 LocalDate， 
男 一 部 分 是 时 间 LocalTime。 它 们 的 用 法 也 很 直观 ， 比 如 : 


// 表 示 2017 征 7 月 114 
LocalDate 1d = LocalDate.of(2017, 7, 11); 

// 当 前 ij 时 刻 按 系统 默认 时 区 x 解读 的 日 期 

LocalDate now = LocalDate.now(); 

// 表 示 21 所 19 分 34 秒 

LocalTime 1t = LocalTime.of(21, 10, 34); 

// 当 前 前 时 刻 按 系统 默认 时 区 x 解读 的 时 间 

LocalTime time = LocalTime.now!(); 

LocalDateTime 由 LocalDate 和 LocalTime 构 成 ,，LocalDate 加 上 时 间 可 以 构成 


LocalDateTime 由 LocalDate 和 LocalTime 构 成 ，LocalDate 加 上 时 间 
可 以 构成 LocalDate-Time，LocalTime 加 上 日 期 可 以 构成 
LocalDateTime， 比 如 : 


LocalDateTime ldt = LocalDateTime.of(2017, 7, 11, 20, 45, 5); 
LocalDate 1d = ldt.toLocalDate(); //2017-07-11 

LocalTime 1t = ldt.toLocalTime(); // 20:45:05 
//LocalDate 加 上 时 间 ， 结 果 为 2017-07-11 21:18:39 

LocalDateTime ldt2 = ld.atTime(21, 18, 39); 

//LocalTime 加 上 日 期 结果 为 2016-03-24 20:45:05 

LocalDateTime ldt3 = lt.atDate(LocalDate.of(2016, 3, 24)); 


5.ZonedDateTime 


ZonedDateTime 表 示 特 定时 区 的 日 期 和 时 间 ， 获 取 系 统 默 认 时 区 的 
当前 日 期 和 时 间 ， 代 码 为 : 


ZonedDateTime zdt = ZonedDateTime,now( ) ; 


LocalDateTime.now () 也 是 获取 默认 时 区 的 当前 日 期 和 时 间 ， 有 
什么 区 别 昵 ? Local-DateTime 内 部 不 会 记录 时 区 信息 ， ET 
年 月 日 时 分 秒 等 信息 ， 而 ZonedDateTime 除 了 记录 日 历 信息 ， 还 会 记录 
时 区 ， 它 的 其 他 大 部 分 构建 方法 都 需要 显 式 传递 时 区 ， 比 如 : 


// 根 据 Instant 和 时 区 构建 zonedDateTime 

public static ZonedDateTime ofInstant(Instant instant, ZoneId zone ) 

// 根 据 LocalDate、LocalTime 和 ZoneId 构 造 

public static ZonedDateTime of(LocalDate date, LocalTime time, ZoneId zone) 
ZonedDateTime 可 以 直接 转换 为 Instant， 比 如 : 

ZonedDateTime ldt = ZonedDateTime,now( ) ; 

Instant now = ldt.toInstant(); 


26.5.2 ”格式 化 


Java 8 中 ， 主 要 的 格式 化 类 是 java.time.format.DateTimeFormatter， 
它 是 线程 安全 的 ， 看 个 例子 : 


DateTimeFormatter formatter = DateTimeFormatter ,ofPattern( 
"yyyy-MM-dd HH:mm:ss"); 

LocalDateTime ldt = LocalDateTime.of(2016,8,18,14,20,45); 

System.out.println(formatter.format(1dt)); 


输出 为 : 


2016-08-18 14:20:45 


和 将 字符 串 转 化 为 日 期 和 时 间 对 象 ， 可 以 使 用 对 应 类 的 parse 方 法 ， 
比如 : 


DateTimeFormatter formatter = DateTimeFormatter ,ofPattern( 
"yyyy-MM-dd HH:mm:ss"); 

String str = "2016-08-18 14:20:;45"; 

LocalDateTime ldt = LocalDateTime.parse(str, formatter); 


26.5.3 ”设置 和 修改 时 间 


修改 时 期 和 时 间 有 两 种 方式 ， 一 种 是 直接 设置 绝对 值 ， 男 一 种 十 
在 现 有 值 的 基础 上 进行 相对 增 减 操 作 ，Java 8 的 大 部 分 类 都 支持 这 两 种 
方式 。 另 外 ，Java 8 的 大 部 分 类 都 是 不 可 变 类 ， 修 改 操作 是 通过 创建 并 
返回 新 对 象 来 实现 的 ， 原 对 象 本 身 不 会 变 。 我 们 来 看 一 些 例子 。 


调整 时 间 为 下 午 3 点 20 分 ， 代 码 为 : 


LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.withHour(15).withMinute(20).withSecond(0).withNano(0); 


还 可 以 为 : 


LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.toLocalDate().atTime(15, 20); 


3 小 时 5 分 钟 后 ， 示 例 代码 为 : 


LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.plusHours(3).plusMinutes(5); 


LocalDateTime 有 很 多 plusXXX 和 minusXXX 方 法 ， 分 别 用 于 相对 
增加 和 减少 时 间 。 


今天 0 点 ， 可 以 为 ; 


LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.with(ChronoField.MILLI_ OF_DAY, 0); 


ChronoField 是 一 个 枚 举 ， 里 面 定义 了 很 多 表示 日 历 的 字段 ， 
MILLI_OF_DAY 表 示 在 一 天 中 的 上 毫秒 数 ， 值 从 0 到 
(24*60*60*1000) -1。 还 可 以 为 : 
LocalDateTime ldt = LocalDateTime.of(LocalDate.now(), LocalTime.MIN); 


LocalTime.MIN 表 示 "00: 00"。 也 可 以 为 : 


LocalDateTime ldt = LocalDate.now().atTime(0, 0); 


下 周二 上 午 10 点 整 ， 可 以 为 : 


LocalDateTime ldt = LocalDateTime.now(); 
ldt = ldt.pluswWeeks(1).with(ChronoField.DAY_OF_WEEK, 2) 
.With(ChronoField.MILLI_OF_DAY, 0).withHour(10); 


上 面 下 周二 指定 是 下 周 ， 如 果 走 下 一 个 周二 呢 ? 这 与 当前 是 周 几 
有 天， 如 果 当 前 是 周一 ， 则 下 一 个 周二 就 是 明天 ， 而 其 他 情况 则 是 下 
周 ， 代 码 可 以 为 : 


LocalDate 1d = LocalDate.now(); 
if(!ld.getDayofweek().equals(DayOfweek ,MONDAY ) ){ 
ld = ld.plusweeks(1); 


} 
LocalDateTime ldt = ld.with(ChronoField.DAY_OF_WEEK, 2).atTime(10, 0); 


针对 这 种 复杂 一 点 的 调整 ， Java 8 有 一 个 专门 的 接口 
TemporalAdjuster， 这 是 一 个 函数 式 接口 ， 定 义 为 : 


public interface TemporalAdjuster { 
Temporal adjustInto(Temporal temporal); 
} 


Temporal 是 一 个 接口 ， 表 示 日 期 或 时 间 对 象 ，Instant 、 
LocalDateTime 和 LocalDate 等 都 实现 了 它 ， 这 个 接口 束 是 对 日 期 或 时 间 
进行 调整 ， 还 有 一 个 专门 的 类 TemporalAdjusters， 里 面 提 供 了 很 多 
TemporalAdjuster 的 实现 。 比 如 ， 针 对 下 一 个 周 几 的 调整 ， 方 法 是 : 


public static TemporalAdjuster next(DayOofweek dayOfweek ) 


针对 上 面 的 例子 ， 代 码 可 以 为 : 


LocalDate 1d = LocalDate.now(); 
LocalDateTime ldt = ld.with(TemporalAdjusters.next( 
DayOfweek ,TUESDAY) ) ,atTime(10，0)， 


这 个 next 方 法 是 雯 么 实现 的 呢 ? 看 代码 : 


public static TemporalAdjuster next(DayOfweek dayOofweek) { 
int dowValue = dayofweek.getValue(); 


return (temporal) -> { 
int calDow = temporal.get(DAY_OF_WEEK ) ， 
int daysDiff = calDow - dowValue; 
return temporal.plus(daysDiff >= 0 ? 7 - daysDiff : -daysDiff, DAYS); 
}; 
} 


它 内 部 封装 了 一 些 条 件 判 断 和 具体 调整 ， 提 供 了 更 为 易 用 的 接 
器 o 
TemporalAdjusters 中 还 有 很 多 方法 ， 部 分 方法 如 下 : 


public static TemporalAdjuster firstDayOofMonth() 

public static TemporalAdjuster lastDayofMonth() 

public static TemporalAdjuster firstInMonth(DayOofweek dayofweek ) 
public static TemporalAdjuster lastIinMonth(DayOofweek dayofweek ) 
public static TemporalAdjuster previous(DayoOfweek dayofweek) 
public static TemporalAdjuster nextorSame(DayOfweek dayOfweek ) 


这 些 方法 的 含义 比较 直观 ， 开 不 解释 了 。 它 们 主要 是 封 狐 了 日 期 
和 时 间 调 整 的 一 些 基本 操作 ， 更 为 易 用 。 


明天 最 后 一 刻 ， 代 码 可 以 为 : 


LocalDateTime ldt = LocalDateTime.of( 
LocalDate.now().plusDays(1), LocalTime .MAX); 


或 者 为 : 


LocalDateTime ldt = LocalTime.MAX.atDate(LocalDate.now().plusDays(1)); 


本 月 最 后 一 天 最 后 一 刻 ， 代 码 可 以 为 : 


LocalDateTime ldt = LocalDate.now() 
.with(TemporalAdjusters.lastDayofMonth()).atTime(LocalTime .MAX); 


lastDayOfMonth () 是 怎么 实现 的 呢 ? 看 代码 : 


public static TemporalAdjuster lastDayOofMonth() { 
return(temporal) -> temporal.with(DAY_OF_MONTH, 
temporal.range(DAY_OF_MONTH) ,getMaximum( ) ) ， 


这 里 使 用 了 range 方 法 ， 从 它 的 返回 值 可 以 获取 对 应 日 历 单位 的 最 
大 最 小 值 ， 展 开 ， 本 月 最 后 一 天 最 后 一 刻 的 代码 还 可 以 为 : 


long maxDayOfMonth = LocalDate ,now(),range( 
ChronoField.DAY_OF_MONTH) .getMaximum( ) ， 
LocalDateTime ldt = LocalDate.now() 
,WithDayofMonth((int)maxDayofMonth) .atTime(LocalTime ,MAX) ， 


下 个 月 第 一 个 周一 的 下 午 5 点 整 ， 代 码 可 以 为 : 


LocalDateTime ldt = LocalDate.now().plusMonths(1) 
.With(TemporalAdjusters.firstInMonth(DayOofweek .MONDAY)).atTime(17, 0); 


26.5.4 时 间 段 的 计算 


Java 8 中 表示 时 间 段 的 类 主要 有 两 个 ，Period 和 Duration。Period 表 
示 日 期 之 间 的 差 ， 用 年 月 日 表示 ， 不 能 表示 时 间 ; Duration 表 示 时 间 
差 ， 用 时 分 秒 等 表示 ， 也 可 以 用 天 表示 ， 一 天 严格 等 于 24 小 时 ， 不 能 
用 年 月 表示 。 下 面 看 一 些 例子 。 


计算 两 个 日 期 之 间 的 差 ， 看 个 Period 的 例子 ; 


LocalDate 1di = LocalDate.of(2016, 3, 24); 
LocalDate 1d2 = LocalDate.of(2017, 7, 12); 
Period period = Period.between(1d1i, 1d2); 
System.out.println(period.getYears() + "和 

+ period.getMonths() + "月 " + period.getDays() + "天 "); 


ET 


输出 为 : 


1 年 3 月 18 天 


根据 生日 计算 年 龄 ， 示 例 代 码 可 以 为 : 


LocalDate born = LocalDate.of(1990, 06,20); 
int year = Period.between(born, LocalDate.now()).getYears(); 


计算 迟到 分 钟 数 ， 假 定 早 上 9 点 是 上 班 时 间 ， 过 了 9 点 算 迟 到 ， 
到 要 统计 迟到 的 分 钟 数 ， 怎 么 计算 呢 ? 看 代码 : 


渍 


long lateMinutes = Duration.between(LocalTime.of(9,0), 
LocalTime.now()).toMinutes(); 


26.5.5 与 Date/Calendar 对 象 的 转换 


Java 8 的 日 期 和 时 间 API 没 有 提供 与 老 的 Date/Calendar 相 互 转换 的 
方法 ， 但 在 实际 中 ， 我 们 可 能 是 需要 的 。 前 面 介绍 了 Date 可 以 与 
Instant 通 过 这 秒 数 相互 转换 ， 对 于 其 他 类 型 ， 也 可 以 通过 曝 秒 
数 /Instant 相 互 转 换 。 比 如 ， 将 LocalDateTime 按 默认 时 区 转换 为 Date， 
代码 可 以 为 : 


public static Date toDate(LocalDateTime ldt){ 
return new Date(ldt.atZzone(ZoneId.systemDefault()) 
.toInstant().toEpochMil1i()); 
} 


将 ZonedDateTime 转 换 为 Calendar， 代 码 可 以 为 : 


public static Calendar toCalendar(ZonedDateTime zdt) { 
TimeZone tz = TimeZone.getTimeZone(zdt.getzone()); 
Calendar calendar = Calendar.getInstance(tz); 
calendar .setTimeInNMillis(zdt.toInstant().toEpochMil11i()); 
return calendar; 


A 


Calendar 保 持 了 ZonedDateTime 的 时 区 信息 。 


将 Date 按 默认 时 区 转换 为 LocalDateTime， 代 码 可 以 为 : 


public static LocalDateTime toLocalDateTime(Date date) { 
return LocalDateTime.ofInstant(Instant.ofEpochMilli(date.getTime()), 
ZoneId,.systemDefault()); 
} 


将 Calendar 转 换 为 ZonedDateTime， 代 码 可 以 为 : 


public static ZonedDateTime toZonedDateTime(Calendar calendar) { 
ZonedDateTime zdt = ZonedDateTime.ofInstant( 
Instant.ofEpochMilli(calendar.getTimeINMillis()), 
calendar .getTimeZone().toZoneId()); 
return zdt,; 


} 


至 此 ， 关 于 Java 8 的 日 期 和 时 间 API 就 介绍 完了 。 相 比 以 前 版 本 的 
ee 它 引 入 了 更 多 的 类 ， 但 概念 更 为 清晰 ， 更 为 强大 和 易 


本 章 介 绍 J 了 Java 8 引入 的 Lambda 表 达 式 、 函 数 式 编程 ， 以 及 日 期 
和 时 间 API， 利 用 本 章 介 绍 的 内 容 ， 我 们 可 以 在 更 高 的 抽象 层次 上 思 
考 和 解决 四 题 ， 包括 处 理 集合 数据 、 管 理 异 步 任 务 、 操 作 日 期 和 时 间 


